码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利

SEO优化评论70
这是码迷SEO的第24篇原创
本文是码迷SEO内参第六篇,本来想写一篇百度索引相关的文章,昨天忽然看到百度对快排打击手段的算法专利,小小的分析了一下。
码迷之前从未找到过针对快排作弊的百度专利,该专利2019年4月份发布,7月30号审核过了,才1个月多一点,感觉新颖的很。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片1

最近也有几个大佬忽悠我说快排周期有所变长,甚至有些人觉得是惊雷算法3的节奏。快拉倒吧,惊雷惊雷惊个毛线雷,从来不下雨的。
这份百度打击快排的专利,大家可以到码迷SEO官方QQ群734299959去自行下载。
根据百度的节奏,一般专利出现后3个月就开始初步灰度落地,半年左右扩展放阀。
无奈魔高一道高一,也就是估计今年年底做快排的老师们可能需要做一点点的技术升级,几行代码就把度娘干的又要出新算法了。
本文会根据快速排名原理做一下分析,君不闻飓风算法3升级后SEO界一点哀鸿遍野的迹象也没有呀,所以未雨绸缪毛线,度娘就是个xx。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片2

相比上一年做快排的老师们都是闷声发大财,今年做快速排名的明显多了起来。
只要是个SEO群,里面就有大佬跟迷妹们吆喝“卖快排喽,不上首页不要钱”。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片3

可见百度被技术大佬们嘿嘿嘿的够呛,就连百度论坛里面的一线站长都掩饰不了对百度算法的信心。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片4

群里面的小伙伴们甚至已经给百度下了定论:百度就是个大垃圾。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片5

丫的,这年头是个SEO就能做快排的节奏。
在这种情况下有些老师也爆出了金句:
现在快排泛滥了,这不是好事

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片6

这怎么不是好事?度娘让大家一块通过快排赚钱,就是好事啊!
所谓天道好轮回,苍天到底饶过谁,佛教里面有个概念叫成、住、坏、空
你现在不做快排,等大家都进来做快排了,你肯定赶不上好时候了。
无论什么SEO技术手段,在生长,维持,颓败中不断演化,最终归为虚无。
就像当年的博客外链一样,正当大家搞得如火如荼的时候,百度一个劈叉下马威,把博客外链权重调低,真是“诸行无常”啊,所以我们SEOer应该信佛。。。
我擦,不知不觉跑歪了。

快排原理

很多公众号都讲快排原理,但都讲的什么破原理,把技术手段搬出来讲是什么玩意儿。
话说,不识本心,学法无益。
快排的本质是通过模拟点击或者发包(确实有)等技术手段,干扰百度训练结果集,让百度认为你就是最接近用户需求的那个天选之子。
举个例子,老王托媒人找对象,李红娘给老王介绍了6个人老王都不要,请问如果你当老王媒人应该找什么样的人。
1 老王跟A罩杯的某女相亲了5分钟离场.
2 老王跟D罩杯的某女相亲了50分钟离场.
3 老王跟100斤的某女相亲了100分钟离场.
4 老王跟200斤某女相亲了10分钟离场.
5 老王跟1米8的某女相亲了3分钟离场.
6 老王跟1米6的某女相亲了300分钟离场.
那是不是你应该找 36D100斤1米6的姑娘更好些。
回到搜索,百度就是媒人,老王就是用户,200斤的某女就是你的网站,然后你找快排大佬硬生生把老王跟200斤的某女锁在一块度过了N天,百度还天真的认为老王过的很幸福。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片7

快排手段拆解

快排一个字总结就是“装”,谁在百度面前装的像,谁就牛逼。
比如我搜索“SEO”,我永远离不开header头里面的参数。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片8

当我点击某个结果网页的时候,除了上面的header头,一堆让人懵逼的参数也要回馈给百度。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片9

做快排的那帮diao人们,就是在合适的时机,给百度发送这些惟妙惟肖的参数。
但是今天的话题不是教大家做快排,而是分析百度会怎么就干不翻那些快排才是重点。
嘿嘿是不是很刺激,这么大的担子落到你身上了,你怕不怕。
码迷说不用怕,只要会故事的三要素就行了。
故事的三要素:时间,地点、人物

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片10

打击快排的手段1:人物维度
快排一般会模拟两类用户:
非登录用户以及登录用户的行为。
对于度娘这种大高(LA)手(JI),即使可以搜到如下数据也不会利用。

【用户单日搜索次数】

如果某一簇用户人均搜索次数均远远超过了平均数,那有点不正常。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片11

【用户行为习惯】

某些快排技术,在做用户滚轮时长、网页下拉的时候,都是固定的值,或者介于一定的范围之内,如果能收集到这些数据,也很容易甄别这些异常用户。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片12

【登录用户非登录用户占比】
从站点维度,如果某个站点,访问的非登录用户远远超过登录用户比例,也很容易甄别这些站点。

【临时用户、常驻用户占比】

当我们使用浏览器访问百度的时候,如果是初次访问,会生成一个永久记录的COOKIE,除非清空浏览器缓存,否则这个COOKIE值一直不变。也可以根据这个COOKIE来记录用户的历史搜索行为。
某些快排手段因为资源限制,不断的清理COOKIE,切换用户。这些生成时间小于某个时长的用户,就叫“临时用户”。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片13

网站点击的临时用户占比过大,也不是正常现象啊。

【用户地域穿越行为】

如果某个用户今天12点出现在广东的IP上,12点01分又出现在山东的IP上,13点又出现在美国的IP上,这显然是不合常理的。
这种情况一般出现在那些记录cookie又玩VPS拨号的快排商家中。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片14

打击快排的手段2:地点维度

模拟用户行为离不开产生数据的方法和装置、那么就永远脱离不了IP、MAC、浏览器、客户端、系统类型等等

【单IP搜索量】

在IPv6之前,ip资源永远是稀缺的。
如果一个IP每天产生搜索点击超过了平均数,这点在百度惊雷算法2中已经能够识别了。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片15

【IP资源有效性】
群里大佬也说,现在即使是VPS拨号重复率也很高。
因为现在百度终于已经可以识别你是代理IP以及机房IP,所以并非所有的IP有效果。
在2018年中惊雷算法2已经对快排有所打击,但是打击的手段就仅仅也是对IP资源的识别而已。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片16

但是,IP资源并不是重点,比如一个公司局域网500号人,出口都是1-5个IP,这500号人的点击,百度并不是100%的认为无效。
所以如果大佬有能力跟宽带商合作,即使IP资源不多也非常有效果。

【终端信息熵】

信息熵是什么,一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,信息熵就越高。
因此可以认为信息熵是系统有序化程度的一个度量。
有同学问,这玩意跟快排有毛关系。
无论是发包还是类浏览器模拟,都必须携带header头、cookie等等请求百度服务器。
如果是随机生成的header头,header信息熵必然混乱,信息熵就很高。
如果是固定的header头,header信息熵必然有序,信息熵就很低。
终端信息熵总有一个健康的阀值,根据这个健康的阀值范围,也应该甄别一类快排作坊。
百度之前陆奇大爷都走了,现在百度一个香农大爷都没有啊,哈哈哈哈哈嗝~

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片17

【终端分布比例】
随着4G的普及,其实绝大多数行业都是移动端的访问量多于PC端的,如果某个行业PC端访问量远远高于手机端,那么很可能有快排干扰。
怎么打击,如果你的网站跟行业终端分布比例出路太大,你等着吧。
百度肯定不会掌握这部分数据的,即使百度掌握了这部分数据,内部协调推进也是另一回事了哈哈哈。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片18

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片19

打击快排的手段3:时间维度
这块码迷只想到一点,欢迎补充

【用户路径行为分析】

柏拉图说的好啊:我从哪里来,要到哪里去。
这是个哲学问题,跟丫的快排有毛关系。
举个例子。
真老王今天访问的你的网站,怎么来的,是这样的:
真老王第1步搜:胸闷气短怎么回事(老王觉得胸闷气短,搜了一段怀疑是肺炎
真老王第2步又搜:肺炎什么症状(看了一下肺炎不太像,看到了肺结核的相关资料
真老王第3步又搜:肺结核症状(看了肺结核症状,我擦,怎么这么像?)
真老王第4步又搜:肺结核那家医院好(终于找到了一家莆田系hospital)
真老王第5步到达你的网站,献出了宝贵的绳命

某快排模拟假老王可能是这样的:
假老王第1步搜:肺结核那家医院好
假老王第2步:打开其他家网站,秒关
假老王第3步:打开你家网站,访问了好长时间
显然,真老王的行为自然性要比假老王 可靠的多得多。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片20

在机器学习中,与用户路径算法相关的向量模型也不少,通过真实用户聚类出路由训练集,也可以区分那些简单脑残的点击行为哦。

百度专利解读

百度在2019年4月29提交了打击快排算法相关的专利:《CN201910352770.5 用于处理点击行为数据的方法和装置》
打击的范围:估计百度对自己的算法极不自信,所以锁定的范围主要是泛域名、寄生虫站点等。
(很符合百度特点、先小范围测试哦)

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片21

专利使用的算法
机器学习,主要是从【设备标识】、【用户路径行为分析】两个维度,做聚类分析,前期用人工标示黑帽样本集以及白帽样本集,后期开砍~

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片22

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片23

被打击的对象
鉴于聚类算法的特点,那些点击路径类似于上面案例中“假老王”的访问方法,估计会被打的渣渣都不剩。
但是某度程序猿哪里比得上快排大佬的技术精湛,江山代有才人出,快排大佬科技树多着呢,不出几天,百度就会反过来被大佬们打的渣渣里的渣渣都不剩了

以后如何做好快排

引用群里大佬的一句话:钱加技术

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片24

快排大佬们最不缺的就是钱跟技术
百度已经开了打击快排的第一枪,码迷觉得百度的打击算法很高大上,毕竟百度的猿们也不是吃素的。
虽然这个专利从IP到用户的访问路径均有提及,但是击的范围有限,另外快排大佬们自始至终都是拉着大炮过来的。
百度这次行动,码迷觉得主要目的是黑帽、白帽SEO点击样本的搜集,要不不会存在后端人员做样本库人工标示。
等百度样本搜集完成,经小范围测试后,如果打击效果不错,再灰度扩容。
意味着那个时候,如果凭有限的终端资源、不严谨的模拟参数都会被百度检测出来,那时候做快速排名的老师们稍微做做技术资源升级,就能继续赚钱了。
毕竟,赚钱那么快落,人血馒头那么香香,为什么要做技术升级呢,人家快排还能帮忙点一点竞价链接。
百度出来打击快排专利,笑笑就好了。
毕竟大佬们现在的问题不是干翻百度的问题,而是干翻其他快排竞争者的问题。
声明:
本文由码迷在梦游宿醉中被隔壁老王的键盘顶着指头写成,纯属老王的键盘虚构,跟码迷一点关系的没有,杠精请去骂键盘。
码迷潜心研发了一款纯白帽的关键词密度工具叫摩天楼内容助手,阔以非常科学滴帮助快排大佬们把内容底子打好,让大佬一统江湖指日可待。
本系列首发于www.mamioo.com,同步发布于公众号”码迷SEO“,未经允许不可转载。

码迷SEO独家内参(六) 简析百度对快排打击的最新手段及专利-图片25

文末福利:

摩天楼内容助手正在内测,【免费试用活动】正式开启!
为你排查SEO中原创内容无排名、关键词布局低质、网页主题不集中、相关词数量不足、相关词密度不均5大网页质量问题, 加码迷QQ群734299959可下载软件,了解更多。

扩展阅读:

---码迷SEO独家内参(五) 从收录现象看百度对网页质量的判定级别(上)
---码迷SEO独家内参(四) 从附子SEO流量站套路到百度资源分配策略解析
---码迷SEO独家内参(三)学会这四招爬虫抢着来
---码迷SEO独家内参(二)百度蜘蛛类型及蜘蛛抓取规律揭秘
---码迷SEO独家内参(一)百度搜索引擎的工作原理及流程
---百度SEO内参-码迷SEO独家策略解读【导读】
点击左下方【阅读原文】可查看本篇网站文章。

 
SEO优化外包 避坑指南 SEO优化

SEO优化外包 避坑指南

重要的是,关键词每个月的搜索量是多少。很多词谷歌会收录成百上千万个结果,但是每个月的全球搜索量还不到10个,把这些词做到首页完全没有难度,也没有意义。觉得好看,点好看▼
营销网站SEO优化的最难点在哪里知道吗 SEO优化

营销网站SEO优化的最难点在哪里知道吗

导读:营销网站只是一个营销工具而已,要想营销工具发挥价值,那必须得对营销网站做优化,提升关键词的排名,这样才能通过搜索引擎获取精准流量,精准流量意味着你的精准的潜在客户浏览你的网站,只要是你的潜在客户...
百度索引收录的变化对SEO有什么影响 SEO优化

百度索引收录的变化对SEO有什么影响

我们做SEO时主要关注的数据是收录量和排名,而百度索引量相对来说容易被忽视,但百度索引量是收录的前提,可以导致网站SEO出现诸多问题,因此我们不能忽视百度索引量,根据百度索引量我们还可以做诸多SEO策...
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: