微笑2013 发表于 2014-4-20 19:00:32

采集了590万amazon,收录220万。

全站不分栏目,用sphinx做120万个tag,590万商品
采集不做任何伪原创处理,仅做标题、图片、价格等数据格式化
历时5个月24天,一天才20刀,看来还得买外链去{:14_1237:}

30w 发表于 2014-4-20 19:03:06

lz用什么采集的 火车头吗

微笑2013 发表于 2014-4-20 19:04:12

30w 发表于 2014-4-20 19:03 static/image/common/back.gif
lz用什么采集的 火车头吗

恩,火车头专业版。。。。

eocoy 发表于 2014-4-20 19:11:46

有赚就可以了哈哈:lol:lol:lol

明月 发表于 2014-4-20 19:12:42

域名VPS等成本是多少?:):):):):):):)

hudba 发表于 2014-4-20 19:12:48

一个月就是600,稳定吗?
上次就看你做了,这么搞符合amz条款不。
如果不能放大就比较辛苦。

微笑2013 发表于 2014-4-20 19:27:39

eocoy 发表于 2014-4-20 19:11 static/image/common/back.gif
有赚就可以了哈哈

收录200多万,如果权重正常,收入一天应该在500刀以上。

小刀轻舞 发表于 2014-4-20 19:28:50

这么搞,难道不会引起Amazon的关注与封杀吗?请懂行的大牛指点。

微笑2013 发表于 2014-4-20 19:29:26

明月 发表于 2014-4-20 19:12 static/image/common/back.gif
域名VPS等成本是多少?

火车头跟sphinx放在一台月租750RMB的服务器上
网站VPS每月30RMB
域名60RMB


这种方式,建站越多平均成本越低。

微笑2013 发表于 2014-4-20 19:30:07

小刀轻舞 发表于 2014-4-20 19:28 static/image/common/back.gif
这么搞,难道不会引起Amazon的关注与封杀吗?请懂行的大牛指点。

amazon不会,google有可能

小刀轻舞 发表于 2014-4-20 19:34:24

微笑2013 发表于 2014-4-20 19:30 static/image/common/back.gif
amazon不会,google有可能

谢谢你的回复,看来给amazon带来流量就没有问题。

微笑2013 发表于 2014-4-20 19:38:28

hudba 发表于 2014-4-20 19:12 static/image/common/back.gif
一个月就是600,稳定吗?
上次就看你做了,这么搞符合amz条款不。
如果不能放大就比较辛苦。


跟amazon条款不冲突,就像你把amazon所有产品都采集放进ecshop,不采集他的review就行。

liwoonゞ 发表于 2014-4-20 19:42:06

想知道收录220万,一天有多少流量了

wawylysys 发表于 2014-4-20 19:42:20

sphinx是什么,求科普,楼主为什么不按着asin来采集呢

hudba 发表于 2014-4-20 19:53:17

楼主加油,过程都是比较辛苦。能放大就好了。数字后面加个0:lol

getpower 发表于 2014-4-20 19:55:21

产出比投入高,要是不嫌麻烦,多建几个不知产出比会不会不下降

Tran 发表于 2014-4-20 20:02:25

就一个站?                                 

amzgoogle 发表于 2014-4-20 20:07:31

怎么采集到这么多的数据,你真牛。

微笑2013 发表于 2014-4-20 20:17:52

liwoonゞ 发表于 2014-4-20 19:42 static/image/common/back.gif
想知道收录220万,一天有多少流量了

400多IP{:14_1240:}{:14_1240:}{:14_1240:}

微笑2013 发表于 2014-4-20 20:21:49

wawylysys 发表于 2014-4-20 19:42 static/image/common/back.gif
sphinx是什么,求科普,楼主为什么不按着asin来采集呢

sphinx是一个全文搜索引擎,能从几千万条数据中以几毫秒的速度搜索出相关内容
而且sphinx最新版本已经能直接显示非索引字段的内容,不再需要联合mysql查询
整个网站运营状态,基本上不需要用到mysql

微笑2013 发表于 2014-4-20 20:22:38

hudba 发表于 2014-4-20 19:53 static/image/common/back.gif
楼主加油,过程都是比较辛苦。能放大就好了。数字后面加个0

做一个大站是一样的。

微笑2013 发表于 2014-4-20 20:23:04

Tran 发表于 2014-4-20 20:02 static/image/common/back.gif
就一个站?

恩,一个站。。。。。。。。。。。。。。。。

微笑2013 发表于 2014-4-20 20:23:28

amzgoogle 发表于 2014-4-20 20:07 static/image/common/back.gif
怎么采集到这么多的数据,你真牛。

这都是小问题了。很好解决。

qq402717704 发表于 2014-4-20 20:28:57

微笑2013 发表于 2014-4-20 20:17 static/image/common/back.gif
400多IP

流量太小了,我去年也有一个amazon采集的 收录最高6W,IP最高也有400IP

wolfstyle 发表于 2014-4-20 20:34:27

好牛,我的采集了30w,就卡的不会动了,求亲的服务器配置

RootSir 发表于 2014-4-20 20:39:25

:( 好牛啊 ! :D                              

x10 发表于 2014-4-20 20:55:17

这个收录量,这样的ip太少了吧

wawylysys 发表于 2014-4-20 21:03:47

微笑2013 发表于 2014-4-20 20:21 static/image/common/back.gif
sphinx是一个全文搜索引擎,能从几千万条数据中以几毫秒的速度搜索出相关内容
而且sphinx最新版本已经能 ...

有相关的使用方法教程吗,找了一下都只是说概念,不知道具体应用

foxconndmd 发表于 2014-4-20 21:11:38

微笑2013 发表于 2014-4-20 20:17 static/image/common/back.gif
400多IP

US流量有多少?:Dhttp://www.cnwebmasters.com/static/image/smiley/default/smile.gifhttp://www.cnwebmasters.com/static/image/smiley/default/smile.gifhttp://www.cnwebmasters.com/static/image/smiley/default/smile.gifhttp://www.cnwebmasters.com/static/image/smiley/default/smile.gifhttp://www.cnwebmasters.com/static/image/smiley/default/smile.gif:):)

炫爱炎 发表于 2014-4-20 21:36:44

不是说采集的会被K吗,怎么楼主还可以赚刀刀啊

微笑2013 发表于 2014-4-20 21:54:03

qq402717704 发表于 2014-4-20 20:28 static/image/common/back.gif
流量太小了,我去年也有一个amazon采集的 收录最高6W,IP最高也有400IP

恩,外链做少了。这段时间加一些。

微笑2013 发表于 2014-4-20 21:55:17

wolfstyle 发表于 2014-4-20 20:34 static/image/common/back.gif
好牛,我的采集了30w,就卡的不会动了,求亲的服务器配置

E3-1230 好像是双核   16G内存

微笑2013 发表于 2014-4-20 21:56:38

炫爱炎 发表于 2014-4-20 21:36 static/image/common/back.gif
不是说采集的会被K吗,怎么楼主还可以赚刀刀啊

采集也要看怎么采集,格式化采集与普通采集还是有区别的

qq402717704 发表于 2014-4-20 22:02:14

微笑2013 发表于 2014-4-20 21:56 static/image/common/back.gif
采集也要看怎么采集,格式化采集与普通采集还是有区别的

楼主 能不能普及一下格式化采集的意思!

wolfstyle 发表于 2014-4-20 22:02:28

微笑2013 发表于 2014-4-20 21:56 static/image/common/back.gif
采集也要看怎么采集,格式化采集与普通采集还是有区别的

哦。我是标准采集,带代码了,格式化不会用,都是用的自带的正文提取

zhasyl 发表于 2014-4-20 22:16:19

采集还有这多门道?什么是格式化采集,能不能举个例子!

微笑2013 发表于 2014-4-20 22:17:00

qq402717704 发表于 2014-4-20 22:02 static/image/common/back.gif
楼主 能不能普及一下格式化采集的意思!

普通采集就是你要把内容采集后发布到dedecms
格式化采集就是你要把内容采集后发布到ecshop
dedecms只需要一个title一个content
而ecshop需要title、price、thumb、content等等。
采集信息格式化也是google、百度等搜索引擎正在发展的方向
很明显的例子就是google、百度已经能抓取论坛帖子的发帖时间及回帖人数
做SEO就要走在搜索引擎前面,fuck the rules,and they die!

minlab 发表于 2014-4-20 22:20:36

本帖最后由 minlab 于 2014-4-20 22:22 编辑

其实我最关心的是amazon链接有没隐藏. :loveliness:
1.amazon链接隐藏估计amazon会把你账号k
2.不隐藏链接的话估计google会把你的网站给k了.
.................................................
这个问题基本无解


chenyox 发表于 2014-4-20 22:22:12

现在采集amazon流量不好搞,同样是采集的我1月份搞到7k多刀,现在情况不怎么好,也在改变采集的思路:D

微笑2013 发表于 2014-4-20 22:28:30

minlab 发表于 2014-4-20 22:20 static/image/common/back.gif
其实我最关心的是amazon链接有没隐藏.
1.amazon链接隐藏估计amazon会把你账号k
2.不隐藏链接 ...

没隐藏,直链+nofollw。。

jiaruseng 发表于 2014-4-20 22:29:15

楼主是技术型人才啊 请问是不是用sphinx+php 就可以了
数据库用json文本文件?
有没有详细些的sphinx用法 搜索了一些教程 感觉不够详细

qq402717704 发表于 2014-4-20 22:30:01

微笑2013 发表于 2014-4-20 22:17 static/image/common/back.gif
普通采集就是你要把内容采集后发布到dedecms
格式化采集就是你要把内容采集后发布到ecshop
dedecms只需要 ...

差不多,按你的来说,我的也算是格式化采集。

我用的DEDECMS,但不止是title coneent,

用DEDECMS的自定义字段,也有title、price、thumb、content...

zhasyl 发表于 2014-4-20 22:33:44

chenyox 发表于 2014-4-20 22:22 static/image/common/back.gif
现在采集amazon流量不好搞,同样是采集的我1月份搞到7k多刀,现在情况不怎么好,也在改变采集的思路
...

是今年的一月份?!我的水平还是不行!

生魚片 发表于 2014-4-20 22:45:22

图片本地化吗?
还是直接调用AMZ的?
如果单纯数据库的话 SSD的VPS 完全撑得住

chenyox 发表于 2014-4-20 22:45:24

zhasyl 发表于 2014-4-20 22:33 static/image/common/back.gif
是今年的一月份?!我的水平还是不行!

是呀,3月份收1月份的钱嘛~~ 好像Google能慢慢识别你的做法一样,很快同样的方法流量就不行了,不过我是宁愿Google K也不要Amazon K就是了~~~

hudba 发表于 2014-4-20 23:45:45

微笑2013 发表于 2014-4-20 20:17 static/image/common/back.gif
400多IP
每100ip 5刀,还过得去,我的一个项目还有500ip才十几刀的,气死。:lol
楼主多个域名有没有准备试试看呀?



54clz 发表于 2014-4-21 00:14:25

采集量真大啊。。。。。。。。

鍋子 发表于 2014-4-21 00:37:43

这几天也闲下来也在研究AMZ了

阿尔萨斯 发表于 2014-4-21 00:42:31




一个站死了,换个域名又是个新站,是这个意思吗:lol

pwzx 发表于 2014-4-21 06:44:36

楼主,如果加几个域名在这个站上,看看有效果不

ebookyx 发表于 2014-4-21 09:47:33

学习一下amazon采集               

宠儿 发表于 2014-4-21 11:12:19

火车头跟sphinx放在一台月租750RMB的服务器上
网站VPS每月30RMB
域名60RMB

请问楼主服务器在哪里买的啊。。 vps呢。。谢谢

北邙 发表于 2014-4-21 11:27:45

一样搞采集 我的采集量只怕也不少
但是网站数量一旦上去 管理是一个大问题
另外 有收录不等于有流量 而且采集站 google K得太快了
基本有流量的时候 就那么两三个月
一旦没流量了 挂在那里占用服务器资源。。。几个站还能搞的来 几百个的话 ..头疼 ...

richboy518 发表于 2014-4-21 13:05:09

一天20刀,成本是多少呢?         


xinyf88 发表于 2014-4-21 13:21:50

这样前期还能赚些,后面几个月就不行了

terryseo 发表于 2014-4-21 13:46:54

这个如果容易复制,那么多整些出来,10个,100个,1000个

willok 发表于 2014-4-21 13:50:21

590万数据其实不算多

我关心的是楼主采集的价格,amazon商品的价格随时都在变,楼主网站显示的价格都是采集当时的价格。这种容易被amazon K吧

xyzqh 发表于 2014-4-21 18:24:51

现在采集amazon速度过快还封IP

andypl 发表于 2014-4-21 19:17:55

前年随便用wprobot采集的站做adsense,一天也有20刀,不过火了1个多月,流量大起来后就被google给k掉了,还警告了ad账户,现在还在采集加TBS伪原创,没什么好的效果。

andypl 发表于 2014-4-21 19:20:57

看楼主的意思是做amazon的不能采集它网站上的review吗?求解

TEeec 发表于 2014-4-21 19:26:45

楼主是大牛,俺不可比。还在门外呢

manman008 发表于 2014-4-21 21:21:19

够威猛的, 采集这么多数据···

看样子不管做什么,都要上量才行啊

8797yooti 发表于 2014-4-22 11:02:56

大数据时代?
看来量大了,还是有好处呀.

麦康 发表于 2014-4-22 18:30:48

在学习中。继续深造,楼主加油

ourcubk 发表于 2014-4-23 00:07:52

为啥我同类型的网站,几乎一模一样的做法,每天才10ip呢?

名牌小子 发表于 2014-4-23 00:48:03

   多元化的采集才是王道   还有 尽量改变   帝国cms就挺强的

dingyangfan 发表于 2014-4-23 15:49:39

可以交流一下么。qq 8094731

比亚 发表于 2014-4-23 18:28:06

这个很牛,不知能持续多久

coffeeter 发表于 2014-4-23 20:37:07

。。。。。没想到现在还能用采集忽悠谷歌。。。。。我以为谷歌已经免疫了呢。

why5711351 发表于 2014-4-24 10:10:09

以后收录会不会越来越少
我以前弄的采集站都这样

lomboz 发表于 2014-4-25 17:58:47

几年前流行的wordpress auto blog 插件还能用么

jeffseo 发表于 2014-4-28 11:36:06

微笑2013 发表于 2014-4-20 22:17 static/image/common/back.gif
普通采集就是你要把内容采集后发布到dedecms
格式化采集就是你要把内容采集后发布到ecshop
dedecms只需要 ...

楼主的意思是格式化采集被K的机率要小于普通采集?
另外想问下楼主网站用的什么程序?

页: [1]
查看完整版本: 采集了590万amazon,收录220万。