已拦截的网址(运行状况)

网络营销评论74
已拦截的网址(运行状况)-图片1

已拦截的网址(运行状况)工具给出了Googlebot统计到的网站robots.txt文件已经拦截Googlebot抓取的网址,可以让站长和东莞seo人员清楚地了解到robots.txt文件的设置是否符合自己的预期。此工具还有一项很被站长和东莞seo人员依赖的robots.txt测试工具,比其他站长工具中只是辅助编写robots.txt文件要强大得多。大部分站长和东莞seo人员在制作robots.txt文件时,经常会有个疑问,就是编写的规则是否正确,是否能够屏蔽目标URL,是否屏蔽了不该屏蔽的URL

已拦截的网址(运行状况)-图片2

简单一级目录的屏蔽规则很容易确定,但是对于涉及多层目录或者通配符的规则,很多人是拿捏不准的,此时保险起见,还是要多用此工具进行一些测试。

假设,不确定“Disallow:/tmp”是不是能屏蔽以下3URL:

www.pizirui.com/tmpdaf

www.pizirui.com/dfsef/tmpdaf

www.pizirui.com/tmp/

就可以用此工具测试一下,测试结果如图7-54所示,可见“Disallow:/tmp”并不能拦截根目录下非tmp”开头的URL,也就是说可以拦截域名后以“tmp”开头的URL,并不能拦截其他含有tmp”字符串的URL。如果网站robots.txt文件已经有了一定量的拦截规则,那么在新网站URL结构的设计中就要多多使用Google Webmaster工具进行测试一下,以防辛苦设计的URL不被搜索引擎收录。

这个测试工具是针对Googlebot的,虽然大部分情况下各个搜索引擎都是通用的,但是不同搜索引擎也会有一定的差异。比如百度对robots.txt协议的解析有点不同,在百度官方帮助文档中就有这么一个匹配(如图7-55所示),看最后一行/tmp并不能匹配/tmphoho,但是上面测试中,Google Webmaster给出的测试结果/tmp是能够匹配/tmpdaf的。/tmphoho/tmpdaf是同一种结构,但是两个搜索引擎的匹配情况不同。所以在制作robots.txt文件时,一定要注意这方面的问题。或者使用更精准的写法,不使用以上模糊匹配的写法,或者多多研究不同搜索引擎对robots支持规则并进行单独设置,以防出现意外的错误。

已拦截的网址(运行状况)-图片3

已拦截的网址(运行状况)-图片4

长按二维码关注我们吧

不要错过

 
网络营销

阳光下的西瓜,是彩色的…

“阳光下的西瓜,是彩色的...”,看我这哼歌的二傻样,就知道今天在瓜地不是白晒滴,毕竟,抱走了一个超级漂亮的“彩色西瓜”。西瓜“金童”-个小、皮薄、汁甜于Sara而言,最耐吃的当属金童了,毕竟,吃了两...
高考第一天,你还好吗? 网络营销

高考第一天,你还好吗?

十年寒窗苦读,只为这一战 。高考第一天,你还好吗? ……高考可以说是人生的一次转折点,如果你能够调整好心态,就等于在考试中成功了一半。那第一天已经考完了,你是否严格按照之前的建议来做的呢!那我们可以再...
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: