网站被其他三级甚至四级域名恶意镜像,甚至短期内与本站争夺排名,投诉后镜像站排名的确下降,但仍然存在,那么这样的镜像站最终该如何处理?能否让搜索引擎删除该镜像站点的索引和收录呢?
其实这种镜像一般是反向代理,比较好处理。
(1)页面内容跟你的一模一样,里面的各种“站内”链接也能打开。并且不止镜像了你的网站,还有很多其他的网站。我姑且称这种镜像站是“漫无目的”的,因为它针对的不只是你的网站。
例如: 百度搜索site:sitemappy.com
你就可以看到很多很多的网站……
这种网站一般都是批量操作,直接按照规则进行泛域名解析,并且反向代理到目标网站上就算完成任务了。
对付这种镜像网站也很简单。
在页面源代码中head部分加入canonical标签指向自己网站的当前页面;页面链接尽量使用绝对路径(绝对路径维护难度太大的话,可以在head部分加入base标签指定首选域,<base> 标签为页面上的所有链接规定默认地址或默认目标。);最后就是禁止你找到的镜像站的IP/域名对你网站进行访问了(主要防范通过反向代理手段进行镜像的网站)。
例如:
<link rel='canonical' href='http://www.baidu.com/' />
<base href="http://www.baidu.com/" />
另外,如何找到镜像自己网站的,大约有两种方法;
(1)分析网站日志,查看【来源页面】字段与【请求页面】的字段是否符合如下规则:
【来源页面】路径包含【请求页面】路径,并且来源页面的域名并非你的网站,大部分是二级三级域名,甚至有四级域名,先去百度下域名,找到的话,就可以屏蔽掉该请求域名的IP了。
如何找到镜像自己网站的网站?
(1)尽量找到各类域名后缀。比如【.com .cn .org】之类的,大概几百个。
(2)通过excel批量组装出查询指令,比如这样【site:*.域名后缀 inurl:.你的根域名.】
域名后缀,就是(1)里面找到的几百个域名后缀;你的根域名的前后要有点.
这样查询的目的是,从【你能够找得到的所有域名中】去匹配【url含有你的域名的】并且目标符合【通过你的域名+原网站的域名】组成网址的所有URL。
这是反向代理类镜像网站的,就是有原服务器ip和代理服务器ip的那种镜像网站,反向代理类镜像网站封掉了代理服务器的ip之后,镜像网站打开显示的会是403错误等错误状态码,但是用工具查询http状态码返回的是200(镜像网站原服务器ip也已经封掉),这样投诉快照也不管用,这时该怎么办呢?其实这都属于正常情况,最主要的是,镜像网站上已经不存在需要被保护的内容,这样就可以了。当百度蜘蛛重新抓取镜像网站时,就会认为它的内容质量低下,后面自然会删除该镜像站点的索引了。还有一种镜像网站是只有一个ip的,这种好处理,直接封ip,然后投诉快照就行了,
文章来自韩神投稿,公众号韩神叨叨(byhanshin)
《SEO极客》每天的干货分享,能不能博得你的一次转发支持?如果还不行,那么上期赠送的《2015最新移动端优化资料》+本期的《织梦仿站教程》呢?转发朋友圈即送!下期将不再赠送已送过的资料! ——《SEO极客》
↓↓↓ 点击"阅读原文" 【查看更多信息】