|
发表于 2014-2-20 17:09:49
|
显示全部楼层
amnoob 发表于 2014-2-19 23:35 
看了好几遍才看懂了老兄的意思哇
我查了一下statcounter的记录,发现蜘蛛每天都要来呆上半小时 ...
其实我更倾向于这些ip段不是google bot, 这些ip段 66.249.8x.xxx, hostname是 google-proxy-66-249-8x-xxx.google.com, 而google bot 应该是 crawl-66-249-xx-xxx.googlebot.com这样的, 像是人工查站一样,反正它们来了我的采集站必K光, 直接清0。有兴趣的欢迎讨论一下。
有个有趣的现象是,我针对这些ip设置了一下,这些ip来的时候就显示404,结果这些站都只是降权了,没有清0,每天还有少量访问; 而没有设置的,都清0了。
搞采集很累的,楼主不搞是明智之举。
PS: 今天挂了一个amazon jp的号, 是amazon.com的来查岗了,我还以为会是日本那边负责查的呢,损失20多W日元,不多也不少,采集的说挂就挂
各位远离采集远离采集远离采集。。。
|
|