求教下图片站防采集突破的问题

[复制链接]
查看: 3017   回复: 10
发表于 2023-12-8 19:32:46 | 显示全部楼层 |阅读模式
看到一个图片站,想采集,看了下源代码
然后直接输入图片地址打开的图片是乱的
但是前台看到的又是正常的,请问这是什么防采集技术?怎么破?
地址和图片如下
https://18comic.vip/photo/241077
https://cdn-msp.18comic.vip/media/photos/241077/00003.jpg?v=1644588185
回复

使用道具 举报

发表于 2023-12-8 19:33:35 | 显示全部楼层
首先原图肯定是乱序的,首先第一件事就是确认顺序是怎么个乱法.
如果是随机打乱,那肯定还有接口是存储图片正常顺序的.

所以你首先要做的就是"人工拼图",下面是步骤:
1.发现图片全部都是横着分割的
2.找一张上下图片连续的大图,比如第一张图"封面"
3.查看原图和对比正确顺序的图,发现图片只是简单的,横着分成10等份.然后把顺序反转一下.
4.依次验证其他图是不是也是这样,验证后确认图片全部都是,平均分成10等分,然后反转一下顺序.

那解决方案就很简单了,不管啥语言写的爬虫,这种级别的图片编辑基本上都是几行代码的事.
图片爬取下来后,读取图片,获取图片高度,再除以10,分割成[0~9]这是十张小图,再反转一下顺序保存新图就完事了.


求教下图片站防采集突破的问题

00001_r.jpg(29.05 KB, 下载次数: 0)2022-2-12 06:30 上传
点击文件名下载附件

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:34:23 | 显示全部楼层
有大佬指导下吗?
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:35:07 | 显示全部楼层
地址都不发,谁能帮到你
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:35:52 | 显示全部楼层
dizhi tie le
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:36:29 | 显示全部楼层
pt站这种资源一大包。不需要采集这里的啊
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:36:55 | 显示全部楼层
老哥,求个地址
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:37:45 | 显示全部楼层
馒头里面你要多少有多少
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:38:29 | 显示全部楼层
估计是靠js吧求教下图片站防采集突破的问题

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:39:18 | 显示全部楼层
这种一般都是js 控制
回复 支持 反对

使用道具 举报

发表于 2023-12-8 19:40:18 | 显示全部楼层
求教下,具体是哪个js?要采集的话怎么采集?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则