码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)

SEO优化评论72

这是码迷SEO的第25篇原创

对不起各位老师,最近一直忙于摩天楼内容助手的功能升级,没有时间写文章了。

上上一节码迷在《从收录现象看百度对网页质量的判定级别(上)》中提到,百度索引库分为低级索引、普通索引、重要索引三种类型。

今天我们从百度相关专利上一块探讨百度对网页质量的判定方法。

码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)-图片1

先说问题,最近群里有些老师开始反馈,自从2019年8月底后,之前的流量站套路有点不稳定。

有同学说,一天几万个内容就收录50个,收录量越来越少了。

这里面很大一部分网站是采集的问题,这一部分在后续的章节中再说,因为本节只探讨采集之外的问题。

问题是:如何增加收录率?

码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)-图片2

今天的思路是这样,我们先分析百度专利,下一节搜集流量站的数据,再做一下结论。

百度网页质量判定

码迷大约找到了5个百度网页质量相关的专利,我们一个一个来看。

《CN104615705B-网页质量检测方法及装置-授权》

这个是2015年左右的专利,比较早,百度说了对网页质量的判定主要是2个方面,看下图

码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)-图片3

而在另外一个专利《CN104462284B-判定网页质量的方法及系统-授权》提及到的网页质量判定主要是对恶意广告的识别。

码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)-图片4

可以看到,百度对网页质量的初步判定的方法主要有5个维度

维度1:域名

根据网页的入链数量以及入链质量来确定网页的质量,入链数量越多,入链质量越好,一般其网页质量也就越高,即跟其他网页关联度越大,其重要度也越大。

SEO对策:老域名

维度2:内容稀缺性

用于对当前网页所包含的长文本中的分句进行语法语义分析,得到所述分句的句法结构;据所构成的当前网页的知识网络,以及当前网页的标题和/或子标题,生成当前网页的摘要。

根据摘要上与所述目标网页的摘要之间的相似度,达到设定阈值的其他网页的数量和/或对应的相似度;根据统计结果,确定所述目标网页的质量。

SEO对策:保证网页中长文本原创性,尽量在最长文本中加入核心词

维度3:体验维度

网页上面不要有影响用户正常阅读的广告。这里不再多说。

SEO对策:无论是移动端还是PC端,杜绝漂浮类、固定浮动类的菜单、客服框。

维度4:图文丰富度

而在另外一篇百度专利《CN110162797A-文章质量检测方法和装置-公开》中,百度提及影响网页质量的因子有:

文章的字数,图片数量,中英文字数占比,文章的话题分布,段落数。

而且,不同类型网页的质量判定方式不一样。

码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)-图片5

比如图片类的网页当然以判定图片丰富度为主。

SEO对策:一定要关注自己网站行业的优质网站图文比例,该加图加图,该加文字加文字。

维度5:相关性

在2018年11月的百度专利《CN109271580A-搜索方法、装置、客户端和搜索引擎-公开》中,百度提到码迷常常举的例子:

搜索信息为“刘德华老婆”时,对搜索信息进行语义特征提取后,可以确定搜索信息的语义特征可以为“刘德华老婆”、“朱丽倩”等等,若内容页中无“刘德华老婆”、“朱丽倩”时,则该内容页与搜索信息的相关程度较低,页面质量较差。

当搜索信息为“拔丝地瓜”时,若内容页中无“拔丝地瓜”、“地瓜”等关键字,则该内容页与搜索信息的相关程度较低,页面质量较差。

码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)-图片6

你内容好,不是因为你核心词密度屌,而是你相关性牛逼,这也是摩天楼内容助手在处理的问题。

码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)-图片7

SEO对策:做网页不仅要做核心词布局,相关词也要有所涉及,有能力的可以布局更多的相关词。

至于其他的维度码迷没有统计太多,因为百度的专利太多太多了!

其实上面的维度大家多多少少都知道,做流量站无非是选好的域名,做好的内容。

说起来简单,但是执行起来很难的。

毕竟任何网站都做不到网页100%被百度收录、100%被百度判定为优质网页。

码迷在《码迷SEO内参(四) 从附子SEO流量站套路到百度资源分配策略解析》中反复强调了百度资源分配策略,你可以给百度好的一面,也可以给百度坏的一面,但是一定要保证好坏平衡。

一看字数已经奔2000了,今天先到这里,搜索专利有点费劲~

下节拿案例开讲。

本系列首发于www.mamioo.com,同步发布于公众号”码迷SEO“,未经允许不可转载。

码迷SEO独家内参(七) 探秘百度专利看百度对网页质量的评估方法(中)-图片8

文末福利:

摩天楼内容助手正在内测,【免费试用活动】正式开启!
为你排查SEO中原创内容无排名、关键词布局低质、网页主题不集中、相关词数量不足、相关词密度不均5大网页质量问题, 加码迷QQ群734299959可下载软件,了解更多。

扩展阅读:

---码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利

---码迷SEO独家内参(五) 从收录现象看百度对网页质量的判定级别(上)
---码迷SEO独家内参(四) 从附子SEO流量站套路到百度资源分配策略解析
---码迷SEO独家内参(三)学会这四招爬虫抢着来
---码迷SEO独家内参(二)百度蜘蛛类型及蜘蛛抓取规律揭秘
---码迷SEO独家内参(一)百度搜索引擎的工作原理及流程
---百度SEO内参-码迷SEO独家策略解读【导读】
点击左下方【阅读原文】可查看本篇源网站文章。

 
SEO浪子:救命的生活小常识,赶快记下来吧! SEO优化

SEO浪子:救命的生活小常识,赶快记下来吧!

1、玻璃扎肉里了怎么办如果打破酒瓶,玻璃碎片散落了一地,可以先将大片的碎片捡起,再用吸尘器将小碎片清理干净。然后,用面粉做成一个个小小的面团,在地上齐齐地滚上几遍,就可以将残留在地板上的玻璃小碎片黏起...
SEO站内优化八大要素(进阶版) SEO优化

SEO站内优化八大要素(进阶版)

如果有人问你百度自然优化的精髓是什么?希望答案不再是“狂发外链”了。如今百度不再是5年前的百度,大量的算法更新对搜索引擎优化者的思维和手法有了更高的要求。然而百度更喜欢系统化用户体验偏向性的优化,站内...
SEO怎样做一个让用户喜欢的网站标题优化? SEO优化

SEO怎样做一个让用户喜欢的网站标题优化?

标题中存在符号的意义是为了帮助用户更好地进行阅读,并没有其他的任何具体意义。在标题中一般使用的符号有以下几种。(1)括号“()”的使用,如图:(3)下划线“_”的使用,如图:(5)方头括号“【】”的使...
为什么学不好SEO 这就是原因!! SEO优化

为什么学不好SEO 这就是原因!!

或许是一些全职太太,在家带孩子,为了实现自己的价值,而想要学习SEO,记得有一位28岁的太太,说想学习SEO,其时记得如同晚上哄完了孩子,然后独自趴在电脑前,一般晚上12点都还会咨询我一些问题,可见当...
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: