搜索引擎索引库的错误网页
在搜索引擎的索引库中,存放着抓取的大量网页内容,在搜索关键词时,搜索引擎就会调用这些内容。这里大多数是很久以前抓取的内容,索引库并没有更新,甚至有的网页已经不存在了,在索引库中的记录还存在很久。
这种现象就是常说的搜索引擎记忆特性,这种特性相当于对数据的缓存,减小错误几率。但是这也会出现很多问题,例如站长删除了网站的错误页面,但是在索引库中仍有记录,这就给网站带来了很大的麻烦。如图7.8所示为某教育网站被挂其他网页,在站长删除后仍然存在于索引库中。
首先这样的内容严重影响网站的主题性,搜索引擎会认为网站作弊,或者网站内容质量不高。对于整个网站的关键词排名都是不利的。另外,从用户的角度来看,当搜索某网站内容时,过多的错误页面,会大大降低用户体验。
搜索引擎索引库中的错误页面在网站中是无法打开的,也就是网站死链接。很多网站都会出现死链接,在搜索引擎中不能及时更新。为了提高搜索引擎的用户体验,有的搜索引擎提供了死链提交入口,供网站管理者将死链接提交到搜索引擎,以便删除索引库中的错误页面。
例如,百度的提交网站死链的地址是http://zhanzhang.baidu.com/dashboard/index,如图7.9所示为百度死链提交页面。
谷歌网站管理员工具也有死链删除功能,如图7.10所示为谷歌死链提交页面。
向搜索引擎提交死链接,并不一定能及时获得解决,有的甚至不能得到解决。所以即使有删除索引库错误页面的方法,也不能随意地删除收录的页面。最好在更新网站内容的时候多加注意,避免产生错误页面,这样才能有效减少错误页面的产生。