Google Panda 2.0中文详解

  [复制链接]
查看: 2754   回复: 10
发表于 2011-6-30 17:41:07 | 显示全部楼层 |阅读模式
在开始将Google Panda 之前,我们先来了解下Google Panda 的来历。09年的时候Google进行了咖啡因(Google Caffeine)的更新,主要解决了股沟的抓取和索引速度。让股沟可以获取的更加新鲜的内容(比如我的Blog,一般会在3分钟内被股沟抓取和索引)。但是快速的抓取和索引使网页质量判断明显下降,很多无用或者重复性质的内容被索引进去。也就是Google所称的shallow-content site 肤浅内容的网站,在这些内容里面大多是伪原创的文章,也可能是一些没有参考价值的原创的内容。
Google Panda 2.0中文详解
针对搜索结果页的页面质量,股沟先前推出的Google +1 也是为了解决这方面的问题。但是这对于判断一个网页的内容质量肯定不是一个完整的解决方案,于是Google Panda出现了,并且它将不断的进行算法更新。Google panda的主要目的就是剔除那些低质量的页面。即一个有效的页面过滤机制(类似百毒的页面价值判断)。需要说明的是Google Panda不是针对站点的惩罚,而是通过算法进行排名的调整。与此同时,原创内容和信息将获得更好的排名,如研究、深度报道和周到详见的分析等。
Google Panda的设计原理会是哪些?
  • 进行定性研究(这是讲的个人,而不是一个很大的问卷),找出它们认为质量差得原因。通过算法将此部分页面排除掉。
  • 使用结果来定义因素,将股沟测量出来的低质量的页面进行分析建模。来匹配哪些质量差的页面。
从大量的Google Panda的讨论文章来看,Google Panda主要的判断依据是点击流(Clickstream)、页面内容(page content)和链接概况(link profiles),只要在这三者当中表现优异,就不会被列为肤浅的网站。从大量的分析看,目前Google Panda的适用级别为网页级别,并没有细化到关键词级别。同时大量低质量页面也会在无形中给整个站点带来影响。
点击流
准确的说应该是考察的是用户参与度,或者是用户针对页面的反馈信息。主要考察指标可能是:
1、页面跳出率与页面停留时间或者回访率
数据来源:Google Analytics,Google Toolbar和搜索结果页不同链接的点击时间间隔。
单纯的跳出率不能反映页面的质量,比如说我的Blog文章,用户可能看了一篇文章就达到了预期的效果,如果停留时间可可以作为参考依据。只有当两个条件(跳出率高且停留时间短)同时满足时,Google才会判定这个是个肤浅的网站。
2、被大量用户屏蔽的网站
数据来源:Google Chrome插件:Personal Blocklist (by Google)
Personal Blocklist官方介绍:Personal Blocklist 扩展会将您希望阻止显示的网址样式提交给Google。当您阻止或者允许一个网址样式显示时,该扩展同时也会将展示此被阻止或者被允许的网址的搜索结果网页提交给Google。您同意Google可以自由使用此信息来改进我们的产品和服务。
3、社会化网络当中的链接流行度
数据来源:Google自己抓取主流的社会化网络中的链接,如Twitter、Facebook、delicious等。
页面内容
Google肯定会针对页面进行分析,主要考察的是页面中信息量。可能考察的信息为:
  • 网站或页面是否存在大量的重复内容
  • 网站或网页内包含的原创内容的占比
  • 是否有大量的实质内容很少的页面存在
  • 页面是否充斥大量无关广告,影响信息的接收
  • 页面内是否有明显的SEO痕迹,有填充内容存在
  • 如果是模板页面,模板页面的共有部分的数据量
链接情况
  • 社会化网络中链接的流行度(前面已经提及)
  • 是否存在大量的SPAM链接
如何应对Google Panda的更新?
  • 查找网站内流量质量最差的页面,并将这些页面区隔开来。设法修改你的低质量页面,但是不要太过,如果太过了容易招来惩罚。
  • 给你网站的页面分类,按类别去查看数据,比如说广告数量、低质量内容百分比。按照情况进行修改会对搜索引擎屏蔽。(对于Wordpress的站点,可以参考下我的网站的Robots.txt文件哈 http://www.biaodianfu.com/robots.txt
  • 如果您的站点是采集过来的内容,尝试移除他们或使用robots.txt来禁止Google 爬取,并停止采集,手动添加原创内容。
  • 修改网站内的链接,保证每个页面只有一个唯一的链接。保证链接的唯一型。
  • 修改那些过度优化的页面。去除重复堆积的文字等。
  • 做一些提高用户体验的修改, 让页面具有更好的可读性,如修改字体大小,字体样式,字体颜色等
  • 在页面上添加用户可能感兴趣的内容,提供提供相关内容的链接。
  • 到社交网站上推广你的站点,或在网页内添加社会化按钮便于用户分享。
  • 检查网站广告的覆盖率,减少页面中广告的数量,去除弹出广告。
  • 停止SPAM行为吧,SPAM伤身!
http://www.biaodianfu.com/google-panda-update.html

评分

参与人数 1T币 +3 收起 理由
sacrg793 + 3 我很赞同

查看全部评分

发表于 2011-7-3 11:15:56 | 显示全部楼层
起这样一个名字是不是专门用来鄙视天朝的?
回复 支持 反对

使用道具 举报

发表于 2011-7-15 12:47:31 | 显示全部楼层
仔细读了,感谢楼主贡献,很有用。
回复 支持 反对

使用道具 举报

发表于 2011-8-16 19:28:08 | 显示全部楼层
支持了  看了
回复 支持 反对

使用道具 举报

发表于 2011-8-28 18:41:16 | 显示全部楼层
很不错。谢谢了。
回复 支持 反对

使用道具 举报

发表于 2011-9-5 17:52:04 | 显示全部楼层
收藏了看看
回复 支持 反对

使用道具 举报

发表于 2011-9-10 21:46:52 | 显示全部楼层
楼主很强大
回复 支持 反对

使用道具 举报

发表于 2011-9-11 15:32:56 | 显示全部楼层
我觉得绕来绕去,其实就是一句话的问题:搜索引擎要尽力避免emu。所以各种奇门诀窍都是不能长久的。
回复 支持 反对

使用道具 举报

发表于 2011-9-13 21:00:04 | 显示全部楼层
起这样一个名字是不是专门用来鄙视天朝的?
hlzone 发表于 2011-7-3 11:15 Google Panda 2.0中文详解



    说到点子上了,呵呵
回复 支持 反对

使用道具 举报

发表于 2011-9-17 10:51:33 | 显示全部楼层
原创总会靠前的。
回复 支持 反对

使用道具 举报

发表于 2011-9-26 21:53:25 | 显示全部楼层
股沟 呵呵
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

角度

楼主