采集了590万amazon,收录220万。

  [复制链接]
查看: 2653   回复: 71
发表于 2014-4-20 19:00:32 | 显示全部楼层 |阅读模式
全站不分栏目,用sphinx做120万个tag,590万商品
采集不做任何伪原创处理,仅做标题、图片、价格等数据格式化
历时5个月24天,一天才20刀,看来还得买外链去采集了590万amazon,收录220万。

评分

参与人数 2T币 +2 收起 理由
richfox + 1 能告诉我收录120W流量多少吗?
coolyzb + 1 感謝支持!

查看全部评分

回复

使用道具 举报

发表于 2014-4-20 19:03:06 | 显示全部楼层
lz用什么采集的 火车头吗
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 19:04:12 | 显示全部楼层
30w 发表于 2014-4-20 19:03 采集了590万amazon,收录220万。
lz用什么采集的 火车头吗

恩,火车头专业版。。。。

回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:11:46 | 显示全部楼层
有赚就可以了  哈哈采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。
回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:12:42 | 显示全部楼层
域名VPS等成本是多少?采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。:):)
回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:12:48 | 显示全部楼层
一个月就是600,稳定吗?
上次就看你做了,这么搞符合amz条款不。
如果不能放大就比较辛苦。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 19:27:39 | 显示全部楼层
eocoy 发表于 2014-4-20 19:11 采集了590万amazon,收录220万。
有赚就可以了  哈哈

收录200多万,如果权重正常,收入一天应该在500刀以上。

回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:28:50 | 显示全部楼层
这么搞,难道不会引起Amazon的关注与封杀吗?请懂行的大牛指点。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 19:29:26 | 显示全部楼层
明月 发表于 2014-4-20 19:12 采集了590万amazon,收录220万。
域名VPS等成本是多少?

火车头跟sphinx放在一台月租750RMB的服务器上
网站VPS每月30RMB
域名60RMB


这种方式,建站越多平均成本越低。

评分

参与人数 1T币 +3 收起 理由
月光飞燕 + 3

查看全部评分

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 19:30:07 | 显示全部楼层
小刀轻舞 发表于 2014-4-20 19:28 采集了590万amazon,收录220万。
这么搞,难道不会引起Amazon的关注与封杀吗?请懂行的大牛指点。

amazon不会,google有可能

回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:34:24 | 显示全部楼层
微笑2013 发表于 2014-4-20 19:30 采集了590万amazon,收录220万。
amazon不会,google有可能

谢谢你的回复,看来给amazon带来流量就没有问题。

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 19:38:28 | 显示全部楼层
hudba 发表于 2014-4-20 19:12 采集了590万amazon,收录220万。
一个月就是600,稳定吗?
上次就看你做了,这么搞符合amz条款不。
如果不能放大就比较辛苦。

跟amazon条款不冲突,就像你把amazon所有产品都采集放进ecshop,不采集他的review就行。

评分

参与人数 1T币 +1 收起 理由
hudba + 1 谢谢分享!

查看全部评分

回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:42:06 | 显示全部楼层
想知道收录220万,一天有多少流量了
回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:42:20 | 显示全部楼层
sphinx是什么,求科普,楼主为什么不按着asin来采集呢
回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:53:17 | 显示全部楼层
楼主加油,过程都是比较辛苦。能放大就好了。数字后面加个0采集了590万amazon,收录220万。
回复 支持 反对

使用道具 举报

发表于 2014-4-20 19:55:21 | 显示全部楼层
产出比投入高,要是不嫌麻烦,多建几个不知产出比会不会不下降
回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:02:25 | 显示全部楼层
就一个站?                                 
回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:07:31 | 显示全部楼层
怎么采集到这么多的数据,你真牛。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 20:17:52 | 显示全部楼层
liwoonゞ 发表于 2014-4-20 19:42 采集了590万amazon,收录220万。
想知道收录220万,一天有多少流量了

400多IP采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 20:21:49 | 显示全部楼层
wawylysys 发表于 2014-4-20 19:42 采集了590万amazon,收录220万。
sphinx是什么,求科普,楼主为什么不按着asin来采集呢

sphinx是一个全文搜索引擎,能从几千万条数据中以几毫秒的速度搜索出相关内容
而且sphinx最新版本已经能直接显示非索引字段的内容,不再需要联合mysql查询
整个网站运营状态,基本上不需要用到mysql

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 20:22:38 | 显示全部楼层
hudba 发表于 2014-4-20 19:53 采集了590万amazon,收录220万。
楼主加油,过程都是比较辛苦。能放大就好了。数字后面加个0

做一个大站是一样的。

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 20:23:04 | 显示全部楼层
Tran 发表于 2014-4-20 20:02 采集了590万amazon,收录220万。
就一个站?

恩,一个站。。。。。。。。。。。。。。。。

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 20:23:28 | 显示全部楼层
amzgoogle 发表于 2014-4-20 20:07 采集了590万amazon,收录220万。
怎么采集到这么多的数据,你真牛。

这都是小问题了。很好解决。

回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:28:57 | 显示全部楼层
微笑2013 发表于 2014-4-20 20:17 采集了590万amazon,收录220万。
400多IP

流量太小了,我去年也有一个amazon采集的 收录最高6W,IP最高也有400IP

回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:34:27 | 显示全部楼层
好牛,我的采集了30w,就卡的不会动了,求亲的服务器配置
回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:39:25 | 显示全部楼层
采集了590万amazon,收录220万。 好牛啊 ! 采集了590万amazon,收录220万。                              
回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:55:17 | 显示全部楼层
这个收录量,这样的ip太少了吧
回复 支持 反对

使用道具 举报

发表于 2014-4-20 21:03:47 | 显示全部楼层
微笑2013 发表于 2014-4-20 20:21 采集了590万amazon,收录220万。
sphinx是一个全文搜索引擎,能从几千万条数据中以几毫秒的速度搜索出相关内容
而且sphinx最新版本已经能 ...

有相关的使用方法教程吗,找了一下都只是说概念,不知道具体应用

回复 支持 反对

使用道具 举报

发表于 2014-4-20 21:11:38 | 显示全部楼层
微笑2013 发表于 2014-4-20 20:17 采集了590万amazon,收录220万。
400多IP

US流量有多少?采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。采集了590万amazon,收录220万。

回复 支持 反对

使用道具 举报

发表于 2014-4-20 21:36:44 | 显示全部楼层
不是说采集的会被K吗,怎么楼主还可以赚刀刀啊
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 21:54:03 | 显示全部楼层
qq402717704 发表于 2014-4-20 20:28 采集了590万amazon,收录220万。
流量太小了,我去年也有一个amazon采集的 收录最高6W,IP最高也有400IP

恩,外链做少了。这段时间加一些。

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 21:55:17 | 显示全部楼层
wolfstyle 发表于 2014-4-20 20:34 采集了590万amazon,收录220万。
好牛,我的采集了30w,就卡的不会动了,求亲的服务器配置

E3-1230 好像是双核   16G内存

点评

e3 1230应该是4核的吧, 服务器一般都用这个CPU  发表于 2014-4-22 10:55
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 21:56:38 | 显示全部楼层
炫爱炎 发表于 2014-4-20 21:36 采集了590万amazon,收录220万。
不是说采集的会被K吗,怎么楼主还可以赚刀刀啊

采集也要看怎么采集,格式化采集与普通采集还是有区别的

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:02:14 | 显示全部楼层
微笑2013 发表于 2014-4-20 21:56 采集了590万amazon,收录220万。
采集也要看怎么采集,格式化采集与普通采集还是有区别的

楼主 能不能普及一下格式化采集的意思!

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:02:28 | 显示全部楼层
微笑2013 发表于 2014-4-20 21:56 采集了590万amazon,收录220万。
采集也要看怎么采集,格式化采集与普通采集还是有区别的

哦。我是标准采集,带代码了,格式化不会用,都是用的自带的正文提取

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:16:19 | 显示全部楼层
采集还有这多门道?什么是格式化采集,能不能举个例子!
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 22:17:00 | 显示全部楼层
qq402717704 发表于 2014-4-20 22:02 采集了590万amazon,收录220万。
楼主 能不能普及一下格式化采集的意思!

普通采集就是你要把内容采集后发布到dedecms
格式化采集就是你要把内容采集后发布到ecshop
dedecms只需要一个title一个content
而ecshop需要title、price、thumb、content等等。
采集信息格式化也是google、百度等搜索引擎正在发展的方向
很明显的例子就是google、百度已经能抓取论坛帖子的发帖时间及回帖人数
做SEO就要走在搜索引擎前面,fuck the rules,and they die!

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:20:36 | 显示全部楼层
本帖最后由 minlab 于 2014-4-20 22:22 编辑

其实我最关心的是amazon链接有没隐藏. 采集了590万amazon,收录220万。
1.amazon链接隐藏估计amazon会把你账号k
2.不隐藏链接的话估计google会把你的网站给k了.
.................................................
这个问题基本无解


回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:22:12 | 显示全部楼层
现在采集amazon流量不好搞,同样是采集的我1月份搞到7k多刀,现在情况不怎么好,也在改变采集的思路采集了590万amazon,收录220万。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 22:28:30 | 显示全部楼层
minlab 发表于 2014-4-20 22:20 采集了590万amazon,收录220万。
其实我最关心的是amazon链接有没隐藏.
1.amazon链接隐藏估计amazon会把你账号k
2.不隐藏链接 ...

没隐藏,直链+nofollw。。

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:29:15 | 显示全部楼层
楼主是技术型人才啊 请问是不是用sphinx+php 就可以了
数据库用json文本文件?
有没有详细些的sphinx用法 搜索了一些教程 感觉不够详细
回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:30:01 | 显示全部楼层
微笑2013 发表于 2014-4-20 22:17 采集了590万amazon,收录220万。
普通采集就是你要把内容采集后发布到dedecms
格式化采集就是你要把内容采集后发布到ecshop
dedecms只需要 ...

差不多,按你的来说,我的也算是格式化采集。

我用的DEDECMS,但不止是title coneent,

用DEDECMS的自定义字段,也有title、price、thumb、content...

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:33:44 | 显示全部楼层
chenyox 发表于 2014-4-20 22:22 采集了590万amazon,收录220万。
现在采集amazon流量不好搞,同样是采集的我1月份搞到7k多刀,现在情况不怎么好,也在改变采集的思路
...

是今年的一月份?!我的水平还是不行!

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:45:22 | 显示全部楼层
图片本地化吗?
还是直接调用AMZ的?
如果单纯数据库的话 SSD的VPS 完全撑得住
回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:45:24 | 显示全部楼层
zhasyl 发表于 2014-4-20 22:33 采集了590万amazon,收录220万。
是今年的一月份?!我的水平还是不行!

是呀,3月份收1月份的钱嘛~~ 好像Google能慢慢识别你的做法一样,很快同样的方法流量就不行了,不过我是宁愿Google K也不要Amazon K就是了~~~

回复 支持 反对

使用道具 举报

发表于 2014-4-20 23:45:45 | 显示全部楼层
微笑2013 发表于 2014-4-20 20:17 采集了590万amazon,收录220万。
400多IP

每100ip 5刀,还过得去,我的一个项目还有500ip才十几刀的,气死。采集了590万amazon,收录220万。
楼主多个域名有没有准备试试看呀?



回复 支持 反对

使用道具 举报

发表于 2014-4-21 00:14:25 | 显示全部楼层
采集量真大啊。。。。。。。。
回复 支持 反对

使用道具 举报

发表于 2014-4-21 00:37:43 | 显示全部楼层
这几天也闲下来也在研究AMZ了
回复 支持 反对

使用道具 举报

发表于 2014-4-21 00:42:31 | 显示全部楼层



一个站死了,换个域名又是个新站,是这个意思吗采集了590万amazon,收录220万。

回复 支持 反对

使用道具 举报

发表于 2014-4-21 06:44:36 | 显示全部楼层
楼主,如果加几个域名在这个站上,看看有效果不
回复 支持 反对

使用道具 举报

发表于 2014-4-21 09:47:33 | 显示全部楼层
学习一下amazon采集               
回复 支持 反对

使用道具 举报

发表于 2014-4-21 11:12:19 | 显示全部楼层
火车头跟sphinx放在一台月租750RMB的服务器上
网站VPS每月30RMB
域名60RMB

请问楼主服务器在哪里买的啊。。 vps呢。。谢谢
回复 支持 反对

使用道具 举报

发表于 2014-4-21 11:27:45 | 显示全部楼层
一样搞采集 我的采集量只怕也不少
但是网站数量一旦上去 管理是一个大问题
另外 有收录不等于有流量 而且采集站 google K得太快了
基本有流量的时候 就那么两三个月
一旦没流量了 挂在那里占用服务器资源。。。几个站还能搞的来 几百个的话 ..头疼 ...

点评

这就得有个系统来管理了  发表于 2014-4-21 13:33
回复 支持 反对

使用道具 举报

发表于 2014-4-21 13:05:09 | 显示全部楼层
一天20刀,成本是多少呢?         


回复 支持 反对

使用道具 举报

发表于 2014-4-21 13:21:50 | 显示全部楼层
这样前期还能赚些,后面几个月就不行了
回复 支持 反对

使用道具 举报

发表于 2014-4-21 13:46:54 | 显示全部楼层
这个如果容易复制,那么多整些出来,10个,100个,1000个

评分

参与人数 1T币 +1 收起 理由
hudba + 1 有見地

查看全部评分

回复 支持 反对

使用道具 举报

发表于 2014-4-21 13:50:21 | 显示全部楼层
590万数据其实不算多

我关心的是楼主采集的价格,amazon商品的价格随时都在变,楼主网站显示的价格都是采集当时的价格。这种容易被amazon K吧
回复 支持 反对

使用道具 举报

发表于 2014-4-21 18:24:51 | 显示全部楼层
现在采集amazon速度过快还封IP
回复 支持 反对

使用道具 举报

发表于 2014-4-21 19:17:55 | 显示全部楼层
前年随便用wprobot采集的站做adsense,一天也有20刀,不过火了1个多月,流量大起来后就被google给k掉了,还警告了ad账户,现在还在采集加TBS伪原创,没什么好的效果。
回复 支持 反对

使用道具 举报

发表于 2014-4-21 19:20:57 | 显示全部楼层
看楼主的意思是做amazon的不能采集它网站上的review吗?求解
回复 支持 反对

使用道具 举报

发表于 2014-4-21 19:26:45 | 显示全部楼层
楼主是大牛,俺不可比。还在门外呢
回复 支持 反对

使用道具 举报

发表于 2014-4-21 21:21:19 | 显示全部楼层
够威猛的, 采集这么多数据···

看样子不管做什么,都要上量才行啊
回复 支持 反对

使用道具 举报

发表于 2014-4-22 11:02:56 | 显示全部楼层
大数据时代?
看来量大了,还是有好处呀.
回复 支持 反对

使用道具 举报

发表于 2014-4-22 18:30:48 | 显示全部楼层
在学习中。继续深造,楼主加油
回复 支持 反对

使用道具 举报

发表于 2014-4-23 00:07:52 来自手机 | 显示全部楼层
为啥我同类型的网站,几乎一模一样的做法,每天才10ip呢?
回复 支持 反对

使用道具 举报

发表于 2014-4-23 00:48:03 | 显示全部楼层
     多元化的采集才是王道   还有 尽量改变   帝国cms就挺强的
回复 支持 反对

使用道具 举报

发表于 2014-4-23 15:49:39 | 显示全部楼层
可以交流一下么。qq 8094731
回复 支持 反对

使用道具 举报

发表于 2014-4-23 18:28:06 | 显示全部楼层
这个很牛,不知能持续多久
回复 支持 反对

使用道具 举报

发表于 2014-4-23 20:37:07 | 显示全部楼层
。。。。。没想到现在还能用采集忽悠谷歌。。。。。我以为谷歌已经免疫了呢。

点评

谷歌也不是万能的  发表于 2014-4-24 08:23
回复 支持 反对

使用道具 举报

发表于 2014-4-24 10:10:09 | 显示全部楼层
以后收录会不会越来越少
我以前弄的采集站都这样
回复 支持 反对

使用道具 举报

发表于 2014-4-25 17:58:47 | 显示全部楼层
几年前流行的wordpress auto blog 插件还能用么
回复 支持 反对

使用道具 举报

发表于 2014-4-28 11:36:06 | 显示全部楼层
微笑2013 发表于 2014-4-20 22:17 采集了590万amazon,收录220万。
普通采集就是你要把内容采集后发布到dedecms
格式化采集就是你要把内容采集后发布到ecshop
dedecms只需要 ...

楼主的意思是格式化采集被K的机率要小于普通采集?
另外想问下楼主网站用的什么程序?

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则