第8节:网站robots协议的用法

网络营销评论76

什么是robots协议?

robots协议,指的是一个robots.txt的文档,如下图。Robots.txt是存放在网站根目录的一个文件。而且是搜索引擎爬虫抓取网站的时候,第一个抓取的文件。第8节:网站robots协议的用法

robots协议,又叫做搜索引擎协议,主要用于规范爬虫抓取网页。robots协议里面记录着规则,爬虫爬取后会按照规则爬取网站。

简单的理解,robots协议里面会告诉搜索引擎爬虫,那些链接是允许爬取的,那些链接是不允许抓取的。

robots协议作用

robots协议可以指定搜索引擎能收录那些链接,也能指定不能收录那些链接。后面我们讲写法。

robots协议语法

robots协议的语法分为三个。分别是User-agent、Disallow、Allow。下面我们来一起了解下。

User-agent:指的是那些搜索引擎执行以下协议。如百度:User-agent: baiduspider。*号可以代表全部,代码为:User-agent:*。

Disallow:指禁止抓取的意思。如语法:Disallow: /a ,就是禁止搜索引擎抓取带有 /a 这个关键词的链接。

Allow:指允许抓取的意思。通常默认就是允许抓取,故很少会用到该命令。

如何去写robots协议

给大家一个非常方便的工具,可以在该工具上直接生产。

Robots协议生成工具:http://tool.chinaz.com/robots/

Robots协议怎么用

1、当网站中存在隐私页面不想被搜索引擎抓取的时候,可以使用robots。

2、当网站页面在多个链接的时候,可以用robots禁用一条,允许搜索引擎只收录一条。(通常使用静态url后,应该屏蔽动态url)

3、建议屏蔽搜索路径。

第8节:网站robots协议的用法

扫一扫开通学习权限,领取精美教程,加入学习交流群

第8节:网站robots协议的用法

 
粉象生活直播和其他直播平台有什么区别? 网络营销

粉象生活直播和其他直播平台有什么区别?

粉象直播和其他直播平台有什么区别?粉‮的象‬直播马上上线!你‮在现‬不花一分钱就‮有拥‬的是万亿的商‮库品‬存,‮会你‬播,你就是‮部头‬的网红主播,‮不你‬会播,你就转‮别发‬人的直播‮相,‬当于你...
页面信噪比控制 网络营销

页面信噪比控制

页面信噪比控制现在大部分网站都会在页面主体内容周围推荐一堆信息和链接,列表页面和内容页面都是如此。甚至有的不是站内信息,而是广告信息。此时为了突出网页的主体内容,就需要控制网站的信噪比,不要在源代码中...
网站被黑怎么办? 网络营销

网站被黑怎么办?

一.如何判断网站被黑先通过外界对网站进行观察,如果有如下现象,那您的网站可能被黑了1、通过百度站长平台的索引量工具,发现站点收录量大增;再通过搜索关键词工具发现,站点获得流量的关键词中有很多与本站点无...
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: