https网页无法收录怎么办?
站长都知道,网页传输有http网页传输和https网页传输。二者不单单是多一个“S”的区别。http和https使用的是完全不同的连接方式,用的端口也不一样,前者是80,后者是443。http的连接很简单,是无状态的。HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议要比http协议安全。
正因为https的安全性,使得一些跟资金有关的站点多数采用https网页。然而,也有一些https网页也是需要搜索引擎抓取和收录的。但是,目前百度搜索引擎却不能主动的抓取https网页,以至于很大部分的https网页。
怎么才能加快https网页的收录,而又对搜索引擎友好呢?解决这一问题从以下几个方面入手
1、制作多版本页面。
为需要被百度等搜索引擎收录的https页面制作http可访问版页面
2、user-agent方法。
通过使用user-agent判断来访者,如果是Baiduspider,则将Baiduspider定向到http页面,如果是普通用户,则通过301重定向到对应的https页面。
3、http版本不是只做首页就OK
http版本页面不仅要做首页的版本,还要做其他重要的页面。而且页面和页面之间要互相连接。
千万不能出现下面的情况
首页http页面上的链接还链向https页面,导致Baiduspider还是无法抓取。http页面上的链接,要链向对应的http页面。
4、无需加密内容用二级域名实现
可以将部分非机密的内容用二级域名来实现。这点可以参考支付宝的站点,该站点将核心的、敏感的内容放在https上,而把非机密内容放在二级域名上,便于Baiduspider进行正常抓取。
-------------------我是分割线--------------------
【好文分享】
不管你在哪里读到有知识有价值的好文章,请记得随手发给李现龙,投稿到521seo@521seo.com,好文章,就是要分享给世人
【关注我】
微信搜索“李现龙”或扫描下方二维码,每日最炫搜索引擎风向和趋势送到您面前