百度搜索引擎的核心技术是百度超链分析,于1997年由百度CEO李彦宏在一份名为“超链文件检索系统和方法”的专利申请中提出,这甚至比Google PR更早提出。
简单地说,超链是别人对你好评,锚文本是别人怎样评价你。
有人做了一个这样的比喻,在一万个人里面,找出10个最高的人比较容易,只是基于高矮直观对比;但在一万个人里面,找出最胆小、最可爱、最漂亮的10个人,就很难选出来了。因为这些抽象的概念很难有相同的标准衡量,这就要通过对每个人的调查、投票等各种方式,才能得出一个结果。因此在被选出的人中,都被多数投票者贴上了最胆小、最可爱、最漂亮的标签。这种投票的方式与百度超链分析技术相似。
百度超链分析算法是搜索引擎建立索引时,除了索引页面及关键词等信息外,还建立一个链接数据库,记录指向这个文件的超链接数量、每个超链接使用的锚文本信息、锚文字中包含哪些关键词等,根据这些链接数据,尤其含有锚文本信息的数据,计算出基于链接的网页相关性。结果排序时,搜索引擎将得到的基于链接的相关性,与基于关键词匹配的传统相关性同时作用,以得到更准确的排名。链接数据库不仅包含关键词原型,也包含同一个词干的其他衍生关键词,使得链接分析数据适用于更多的搜索关键词。例如,网页A和B,它们都是与“网站优化”相关的主题,而网页A获得更多的链接指向,并且含有“网站优化”相关锚文本链接更多,而网页B无论从链接指向的数量,还是锚文本链接的数量都比不上A,所以网页A的排名会优于网页B,如图所示为百度超链分析排名原理。
百度超链分析和Google PR有一定相似的地方,就是统计网页被其他网页链接指向的数据,指向的次数越多等级越高,排名也就更靠前。但是它们也有一定区别:
百度超链分析研究的是网页相关性,而Google PR研究的对象是页面等级;
百度超链分析只计算链接数量和分析锚文本,而Google PR计算每个页面的具体数值:
百度超链分析对链接的源网页无等级差异之分,而Google PR认为链接的源网页有等级之分。
根据百度超链分析技术,东莞SEOer应注意增加外链数量,尤其是关键词相关锚文本外链的数量,另外主题相关页面的链接指向对排名更有帮助。
百度超链分析是一项非常有用的技术,对搜索引擎判断网页相关性,优化搜索结果排序,有着非常大的影响,使搜索引擎更准确地理解目标网页的主题,提高了搜索结果与搜索词的相关性,现在百度根据导出链接页面的权威性、相关性等属性确定导出链接的权重,从而使搜索结果更权威。因此现在很多搜索引擎都借鉴了相似的算法优化排名。