python seo,python挖掘站长之家网站关键词工具

SEO优化评论8

很久没注意网站站长之家的权重变化,昨天一看权2了,统计了一下站长之家的关键词,穷人无法导出,用python爬取下来分析主要流量和一下是否有进步空间。就有了这个python挖掘站长之家网站关键词seo工具和大家分享,可以用来挖竞争对手的网站关键词。

python seo,python挖掘站长之家网站关键词工具-开水网络
站长之家网站关键词挖掘工具

工具源码

#  python3# -*- encoding: utf-8 -*-\'\'\'@File    :   Untitled-1@Time    :   2020/06/21 17:07:07@Author  :   开水@Contact :   admin@hekaiyu.cn@Department   :  Sun Yat-Sen University@Desc    :   站长之家 爬取网站的权重关键词seo脚本\'\'\'import requestsfrom bs4 import BeautifulSoupimport re,sysimport pandas as pdCOOKIES = \'\'data=[]rank=[]def get_html(word,page):    print (\'正在查询{}的第{}页。\'.format(word,page))    url=\'http://rank.chinaz.com/%s-0--0-%d\'%(word,page)    headers = {        \'Accept\': \'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9\',        \'Accept-Encoding\': \'gzip, deflate\',        \'Accept-Language\': \'zh-CN,zh;q=0.9\',        \'Cache-Control\': \'no-cache\',        \'Cookie\': COOKIES,        \'DNT\': \'1\',        \'Pragma\': \'no-cache\',        \'Proxy-Connection\': \'keep-alive\',        \'User-Agent\': \'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.90 Safari/537.36\',    }    resp = requests.get(url, headers=headers)    if resp.status_code != 200:        print(\'页面打开失败\')        sys.exit(1)    rank_data(resp.text)    return resp.textdef rank_data(html):    soup = BeautifulSoup(html, \'html.parser\')    wordList=soup.select(\".ReListCent-visible\")    for li in wordList:        div=li.select(\'.tl\')        rank.append(div[0].get_text())def get_page (word,getType):    page=1    html=get_html(word,page,getType)    page_numberze = r\'col-gray02\\\">共(.+?)页,到第\'    page_number = re.findall(page_numberze, html, re.S)[0]    page_number=int(page_number)    if page_number>10:        page_number=10    if page_number>1 and page<page_number:        page+=1        html=get_html(word,page,getType)if __name__ == \'__main__\':    get_page(\'www.hekaiyu.cn\',\'rank\')    for word in rank:        get_page(word,\'index\')    names = [\'关键词\',\'全网指数\',\'长尾词数\',\'竞价数\',\'收录量\',\'竞争度\']    df = pd.DataFrame(columns = names, data = data)    df.to_csv(\'长尾关键词.csv\',encoding=\'utf_8_sig\')

使用方法

1、填写第19行站长工具的cookie,登录用户可以看5页还是10页,本渣网站顶多两页 无妨。

2、修改65行的网站域名,这样就OK了,执行后结果保存在同目录下的长尾关键词.csv

注意事项:

pythonseo工具挖掘的关键词是网站权重关键词库的结果,就是这个页面的http://rank.chinaz.com/?host=www.hekaiyu.cn。

cookie有时效性,报错记得考虑cookies的因素。

工具下载:

py 网站关键词挖掘.zip python seo,python挖掘站长之家网站关键词工具

 
东莞SEO只有技巧没有秘诀 SEO优化

东莞SEO只有技巧没有秘诀

很多人购买书籍学习东莞SEO,希望能从书籍中找到一些东莞SEO的秘诀,但是很多人都发现,看了很多书也找不到一个屡试不爽的秘诀。需要提醒大家的是,东莞SEO没有秘诀,只有理论和实践。或许有的人不认同,认...
SEO站内优化的一些建议 SEO优化

SEO站内优化的一些建议

一、分析网站每天都要进行网站分析,是作为一个合格的SEO从业人员不可或缺的技能,而网站分析完之后,基本上问他分为两种,1、网站优化没做好,2、网站作弊被惩罚。总得来说,其实SEO无非就是每天分析数据,...
网站页面优化策略 SEO优化

网站页面优化策略

网站的页面优化,也即网页优化是对网页的程序、内容、版块、布局等多方面的优化调整,使其适合搜索引擎检索,满足搜索引擎排名的指标,从而在搜索引擎检索中获得的排名提升,增强搜索引擎营销的效果使网站的产品相关...
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: