有不少朋友都发现了不同的搜索词或搜索方式,得到同一个网页的百度快照时间可能是不同的。如图所示,分别为在百度搜索“www.jume1.com”和“聚美优品”得到的聚美优品官方网站首页的快照,可以看出快照时间并不相同。
搜索引擎更新索引的过程,并不是一个新索引替换老索引的过程,对于一个重要的网页,百度可能会同时保留其多个版本的快照,使用不同的搜索词得到的同一个网页的快照版本可能会有所不同。
如果两次搜索中使用的都是常规搜索词,而出现的同一个网页快照时间不同,一般原因是搜索引擎会在多个快照版本中优先推荐最符合用户搜索词的那一个。因为页面内容变动了,所以关键词相关程度就可能不同了,在存在多个版本快照的情况下可能会出现这种情况。当然这并不是唯一的原因,也可能存在其他外界未知的因素。
如果上述这种情况一个是搜索普通关键词,一个是搜索URL,出现同一个网页的快照时间不同,除了上述原因之外,还有可能是前面搜索引擎原理一章中所提到的,百度缓存中的快照和索引库中的快照版本并不同。当用户搜索普通关键词时,由于之前有人搜索过,所以百度直接从缓存中调出了快照;
当用户搜索URL时,百度并没有使用缓存中的快照,而是使用了索引库中的快照,从而造成了两次搜索中同一网页出现两个版本的快照。据观察,一般直接搜索网页的URL会得到该网页最新版本的百度快照,搜索目标关键词偶尔会出现目标网页快照停滞在比较早时间上的现象。
长按二维码识别关注