“收录量”的估算方法

网络营销评论79

“收录量”的估算方法

因为site指令把搜索范围限制在了指定的域名内,所以站长和东莞seo人员认为如果不填写搜索词,而只用site指令+域名所得到的搜索结果就是该域名所有被收录的页面了,返回的结果数也是搜索引擎对这个网站的收录量。如图所示,site指令+域名所得到的结果都是指定域名内的,且百度给出了“找到相关结果数4 240 000个”,并特别注明这个结果是估算值。在Google中也会同样得到相似的结果,但是在Google中的“结果数”经常会变化很大,往往向后翻几页,显示的结果数就变了。百度相对还好,一般会以周为周期来更新这个数字。

“收录量”的估算方法-图片1

在其他很多地方,百度搜索工程师也都回应site指令给出的结果数只是一个估算值,并不是百度对网站的真实收录量,推荐大家参考百度站长平台的“百度索引量”数据。这里先来解释一下site指令的结果数是怎么估算出来的,后续介绍一下“百度索引量”。如果大家自己还是不明白site指令是怎么进行估算的,那么推荐大家再仔细阅读一下第2章搜索引擎原理一章的有效索引和缓存机制部分。

在第2章搜索引擎原理部分介绍了,搜索引擎并没有呈现索引库中的所有索引网页,而是使用的缓存或者有效索引中的数据。由此推测:在搜索引擎接收到site指令时也不例外,搜索引擎并不会浪费资源去检索整个索引库,而只是在缓存或有效索引中进行匹配检索。site指令所得到的“收录量”为缓存(或有效索引)中该网站的网页数量,乘以搜索引擎缓存(或有效索引)库中的总网页数和整个索引库中网页数的比值,示意公式如下:

“缓存”总网页数

site收录量=该网站在“缓存”中网页数×垂个索引库中网页数

“收录量”的估算方法-图片2

site指令显示的“结果数”差不多就是这样计算出来的,和alexa工具对网站流量的估算类似,并不是搜索引擎根据实际索引库匹配出这些数量的网页。同时搜索引擎的缓存是多级的,有效索引库也是多个,所以对于不同的网站,估算公式中所使用的数据可能会来自不同的“缓存(库)”。

百度官方人员给出的回复大概是:这个site指令是一个估算值,并不是真实的索引量。百度索引网页有很多库,使用site查询时,会随机使用一个“库”中的该网站网页的数量来进行估算。因为“库”是随机的,所以就造成了site指令所给出的数值可能会变动很大。

“收录量”的估算方法-图片3“收录量”的估算方法-图片4

 
我能做什么? 网络营销

我能做什么?

亲爱的各位朋友 大家好!目前你是否感觉生意越来越不好做?你是否感觉钱越来越难挣?你是否感觉客户越来越难找?你是否感觉客户越来越挑剔?你是否感觉自己已经非常努力了,但没有结果?你是否感觉自己花了很多钱做...
网站刚改版, 百度迟迟不收录怎么回事? 网络营销

网站刚改版, 百度迟迟不收录怎么回事?

很多朋友在做网站运营的时候,如果产品对网站进行了AB测试,发现用户更喜欢A,不喜欢B,就会改版。而网站刚改版,百度迟迟不收录,这是怎么回事呢?笔者分析如下:第一,你的网站改版进行的大改版,导致很多UR...
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: