|
可以说PageRank成就了Google,与之类似的算法体系也成就了全球最出色的几个搜索引擎。但是任何事物都会有其生命周期,PageRank也不例外。而且作为搜索巨头的google,它自己也在不断反思研究,也许未来PageRank依然存在,但其实内涵将彻底变化。 不是我危言耸听,说“PageRank过时”或者“不科学”,早就有相关的言论和分析了。具体大家可以参考一下题为“PageRank行将过时搜索引擎遭遇范式转移”的文章,其中从技术的角度阐述了PageRank的种种局限。
在过去10多年,可以说PageRank成就了Google,与之类似的算法体系也成就了全球最出色的几个搜索引擎。但是任何事物都会有其生命周期,PageRank也不例外。而且作为搜索巨头的google,它自己也在不断反思研究,也许未来PageRank依然存在,但其实内涵将彻底变化。
为什么PageRank将越来越过时?
我们来看一下,PageRank算法的基本规则是:某个网页被链接得越多,则该网页的等级和重要性越大,从而在相关性排序中也就越靠前。当然,传统搜索还有很多排序规则来辅助PageRank,让其精准性得到进一步提高。
我曾请教过搜狗的CEO王小川,他提到,为什么Google要做Chrome?抛开云计算、操作系统等战略考虑,其中一个很重要的原因在于,利用浏览器可以分析用户对网站的访问行为,从而对PageRank规则形成补充。因为PageRank只管网页链接的情况,却不关心用户的真正点击行为。
这个小例子可以证明PageRank的过时,或者说起码它不完善。但这并不是PageRank的致命伤,它的真正问题在于——它只考虑了网站自身的权重,而不关心关键词提交者的意图和所处的状况。
我举个简单的例子:同样检索“非诚勿扰”,PageRank会根据自己的算法给出网页权威度的一个排序结果。但实际上网友的需求可能是检索“费城(非诚)勿扰”相亲节目,也可能是电影。可能有人要说,这应该是语义分析应该做的事,PageRank只是根据链接关系进行排序,但两者很难彻底割裂看来,更合适是的是根据不同主题给出不同的重要度排序,现在也有这方面的改进和尝试。随着人类对信息获取需求的提高,搜索会越来越聪明,需要考虑更多越来越多的因素。
情境搜索的兴起
最近Google第一次提到了“情境”这个词,具体技术是“情境发现”(contextual discovery),据说2011年会有应用上线。 “情境发现”从本质上,就是在搜索中,加入更多“人”的因素——用户的浏览习惯、所处的地理位置等,搜索方式也会有新的变革,比如主动推送。显然,Google已意识到这个问题。
Facebook兴起后,被视为Google的颠覆者。颠覆Google,不是因为Facebook流量已实现超越,而是Facebook对人的了解将远远超过Google.这对Google未来的搜索战略是极大的障碍。所以Google十分重视社交网络,在我看来,这并非Google觊觎社交网站,而更多是出于一种自卫。
这显然和PageRank体系的核心有很大区别。决定搜索结果及排序的规则,多出了很多维度,比如上下文关联、浏览习惯、搜索者所处的“情境”等。微软公司一直在研究一种叫“BrowserRank”的算法,其思路也是引入更多维的衡量模型,比如将用户在网站停留的时间作为考量标准之一。实际上,类似这种BrowserRank算法在腾讯等公司也早已经在应用了。 谁能在情境搜索中胜出?
由此可见,随着情境搜索时代的来临,“人”的因素将在搜索技术中占据越来越高的比重。从腾讯对情境搜索的实践可以看出,它强调以人(Who)为本,根据其搜索行为的“时间”(When)、地点(Where)、输入(What)、需求(Want)、习惯(How)、背景(Why)等因素,得到最贴切的搜索结果。
换句话说,搜索服务商对“人”了解越深刻、对其所处的环境了解越透彻,则其越能在情境搜索中占据主动。显然,拥有最海量用户群、最长停留时间、最深的互动关系的平台将在其中拥有天时地利,这也是Facebook、腾讯这样的平台未来的最大机会。
Google曾经也希望用户“找到信息,然后快速离开”,这句话在未来一定是谬论,所以Google也在通过iGoogle等手段将用户留下来,为未来的搜索演变做储备。值得注意的是,“情境搜索”毕竟还处于初级阶段,更像是一种“搜索概念”,从传统搜索到它的演变过程将是缓慢、递进的过程。 |
评分
-
查看全部评分
|