提到伪静态,大家都不陌生了。伪静态页面,指的是通过技术手段把动态网页处理成带有.htm或者.html结尾的地址,看起来是静态页面,这样利于搜索引擎的抓取和收录!
那么,处理成伪静态后,就完了吗?答案是,并没有!事实上我们知道,网页只有静态和动态,伪静态其实也是动态。但是对于搜索引擎来说,他认为伪静态处理后网页变成了静态,所以会更好的收录。
但是这里就会出现一个问题,什么呢?就是说处理完伪静态后,对于搜索引擎来说,一个页面有俩个链接,动态的和静态的都指向同一个页面,这就是镜像页面。对于这种镜像页面,搜索引擎是打击的。包括最近百度出的飓风算法,对采集伪原创的镜像页面开始实施真正意义上的打击和降权了!
那么怎么办才好呢?其实也很简单:写个robots.txt就好了。可以这么写:
User-agent: *
Disallow:/“?”
?表示动态页面
这样的话搜索引擎就不会抓取动态页面了。
其实现在已经出现了静态网页技术,一般.net用的比较多。就是通过cms程序可以生成实实在在的静态页面,跟纯静态页面一样,这样的好处是不需要像动态网页一样频繁的读取数据库数据,减轻了服务器的压力,也不需要处理成伪静态再要写robots麻烦,同时访问速度快,对搜索引擎也非常的友好!