wordpress做的采集站怎么解决文章重复?

  [复制链接]
查看: 720   回复: 11
发表于 2013-6-19 19:55:45 | 显示全部楼层 |阅读模式
有的标题重复,有的标题内容均重复,试了好几个插件和sql都不行!数据量大了的关系 ,非常慢的。
发表于 2013-6-19 19:58:04 | 显示全部楼层
这个需要技术支持,没技术还是不要做采集站
sql使用模糊搜索语句like%%

点评

主要这个站是架设在云上的,本身有很多限制,现在数据量大了操作数据库很容易到上限。。。这就是为什么现有的插件和sql查询删除语句行不通的原因。 换个思路,如果不好去除重复,如何做优化利于seo呢? 我是在google  详情 回复 发表于 2013-6-19 20:26
回复 支持 反对

使用道具 举报

 楼主| 发表于 2013-6-19 20:26:22 | 显示全部楼层
月光飞燕 发表于 2013-6-19 19:58 wordpress做的采集站怎么解决文章重复?
这个需要技术支持,没技术还是不要做采集站
sql使用模糊搜索语句like%%

主要这个站是架设在云上的,本身有很多限制,现在数据量大了操作数据库很容易到上限。。。这就是为什么现有的插件和sql查询删除语句行不通的原因。
换个思路,如果不好去除重复,如何做优化利于seo呢? 我是在google站长工具里看到重复数据的提示才发现问题的!


点评

重复必须去除,否则不利于seo,建议使用独立的vps  发表于 2013-6-21 17:50
回复 支持 反对

使用道具 举报

发表于 2013-6-19 20:30:27 | 显示全部楼层
有插件,你百度找下。
回复 支持 反对

使用道具 举报

发表于 2013-6-19 21:28:30 | 显示全部楼层
通常采集回来的内容,我都是通过SQL分拆、拼接、变换内容、变换标题等等,还有去标题、关键词、标签重复,自己写存储过程和函数,最后插入wordpress的相关表里面。还有定时发布,我没有使用任何定时发布的插件,直接生成所需的发布时间。

点评

请教如何用sql分拆? 我是select数据后用php进行处理的,用sql会效率高些? 求指点  详情 回复 发表于 2013-6-20 06:54
回复 支持 反对

使用道具 举报

发表于 2013-6-20 06:52:56 | 显示全部楼层
cyrich 发表于 2013-6-19 21:28 wordpress做的采集站怎么解决文章重复?
通常采集回来的内容,我都是通过SQL分拆、拼接、变换内容、变换标题等等,还有去标题、关键词、标签重复, ...

都通过sql啊, 这个也太麻烦了吧......
為什麼不使用php啊? 你要是有些变量需要修改,不就得修改存储过程了?



点评

我不会PHP  发表于 2013-6-20 13:09
回复 支持 反对

使用道具 举报

发表于 2013-6-20 06:54:21 | 显示全部楼层
cyrich 发表于 2013-6-19 21:28 wordpress做的采集站怎么解决文章重复?
通常采集回来的内容,我都是通过SQL分拆、拼接、变换内容、变换标题等等,还有去标题、关键词、标签重复, ...

请教如何用sql分拆?

我是select数据后用php进行处理的,用sql会效率高些?

求指点


点评

只会SQL语言,没学过PHP,所以一般使用SQL来编缉数据,必要时就写个存储过程和函数  详情 回复 发表于 2013-6-20 13:11
回复 支持 反对

使用道具 举报

发表于 2013-6-20 13:11:28 | 显示全部楼层
风吹不动 发表于 2013-6-20 06:54 wordpress做的采集站怎么解决文章重复?
请教如何用sql分拆?

我是select数据后用php进行处理的,用sql会效率高些?

只会SQL语言,没学过PHP,所以一般使用SQL来编缉数据,必要时就写个存储过程和函数

回复 支持 反对

使用道具 举报

发表于 2013-6-20 13:20:03 | 显示全部楼层
http://blog.csdn.net/dengwen168/article/details/8832775
用火车头采集和发布比较简单.
回复 支持 反对

使用道具 举报

发表于 2013-6-20 13:37:35 | 显示全部楼层
如果要防止完全重复,给title字段加上Unique索引,不过这样wordpress使用的时候会有一些问题 比如无法自动保存。 或者你另建一个key-value索引表只留ID和TITLE两个字段 然后用它对应wp_posts去重

点评

谢谢!!!!!!!!!!!!  详情 回复 发表于 2013-6-20 19:51

评分

参与人数 1T币 +2 收起 理由
月光飞燕 + 2

查看全部评分

回复 支持 反对

使用道具 举报

 楼主| 发表于 2013-6-20 19:51:37 | 显示全部楼层
mattfox 发表于 2013-6-20 13:37 wordpress做的采集站怎么解决文章重复?
如果要防止完全重复,给title字段加上Unique索引,不过这样wordpress使用的时候会有一些问题 比如无法自动 ...

谢谢!!!!!!!!!!!!

回复 支持 反对

使用道具 举报

发表于 2013-6-21 07:29:58 | 显示全部楼层
这个问题解决了会变成SEO的奥特曼!~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则