相信好多学黑帽SEO的同学都听过百度算法,今天博主就为大家带来一种算法,那就是TF-IDF算法。我们讲算法从来不只讲理论,更多的是实战。如果只是学理论,不实战,那学起来还有什么意义?
一、TF-IDF算法简介
TF-IDF算法包含两个值,一个是TF值,另一个则是IDF值
TF值我们这里可以理解为关键词密度(布局相关),只要相关度足够高、可以直接修改某个关键词的排名!
而IDF则是逆文档频次,这里可以用搜索引擎收录总量除以包含某关键词结果数,然后再求结果的LOG值。
当我们讲到这里,可能好多同学又要懵了,这么复杂?还要不要搞?于是博主以python为工具,借用中文分词框架,写出来以下计算TF-IDF工具。
二、工具及使用
(1)配置关键词及网址
(2)查询关键词及网址的TF-IDF值
三、分析TF-IDF值对关键词有什么影响
1、如下图,(或是看上面石材雕刻机这个案例),两个图都是按排名高低依次计算(只摘取首页部分),细细品这两张图,你一定能找出规律:
你会惊奇的发现,TF-IDF值最高的,比如两个关键词最后一名,TFIDF值都是40+,和排名第一差距一倍多,但是排名也差N多(流量也差N多),并不是所有的东西越高越好。反观也是一样,TFIDF值为0或是比第一低很多的,同样排名也并不好。大家可以拿到工具,自测!
2、凡事排名首页的站,TF-IDF值都在一定范围内
无论是【石材雕刻机】这个词,还是【银杏树】,排名在前10的,基本都10上以(TF-IDF)值,当然也有为0的,也就是非完全匹配(页面中并未完全出现关键词),此时排名比较靠下,在逆冬老师黑帽VIP课中有讲,根据中文分词、相关度算法、此类网页想排名比较困难!
总结:
工具用在布局关键词时比较恰当,举个例子:当你想做一个关键词比如【石材雕刻机】,你可以计算出来排名在首页网页的TFIDF值,参考TF-IDF值布局关键词(增加或减少次数),使自己网页TFIDF值处于一个合适的位置,当然这个合适的位置也有说法,就拿这个词举例,排名第一的值为18,排名2,3的值均在10以下,我们可以把自己的值定在这区间,根据《1》《2》分析,如果网页的TFIDF值太高、或是过低都不利于排名,那我们就取中间位置或是趋近于第1(个人认为第一是趋近于百度标准的值)!无论是SEO还是其他事情,程序比人更靠谱。如果想学黑帽SEO的朋友,或是想要工具的兄弟,加微信3909832,免费送!免费送!免费送!
点击下方阅读原文,了解更多