网页内容的原创度
原创网页是互联网信息量不断发展的推动力,搜索引擎也更支持原创的内容,原创度越高的网站和网页都能得到额外的加分,但是各搜索引擎在原创识别技术的水平并不一致。
2012年8月,百度已经开始研究一套较完善的原创识别算法,解决原创内容的搜索排名问题。在2013年5月,百度原创火星计划正式上线,这也是百度推出的第一套较完整的原创识别算法,新算法的加入,将一些网站的文章被标注上了原创标识,如图2.77所示为百度网页原创识别。
百度明确表示会提高原创内容的排名,从百度研究新算法来看,原创内容作为排名算法因素所占的比例应该还是比较大的,因此原创内容对排名很有利。不过目前百度原创算法只在新闻等少数范围内起作用,目前其他类型原创内容还未涉及,但是未来肯定会实现全行业、全类型的原创内容识别,以及对排名算法的加分作用。