有很多朋友发现百度同时收录了网站URL最后带“/”与不带“/”的两种形式。如图所示,两个URL的快照并不同,可见百度把两个URL当成了不同的页面,曾经一度出现过两种URL共同存在某个关键词的搜索结果首页。
且不论百度会不会把这两种URL当成重复页面对待,站长和东莞seo人员自己首先就应该先把URL进行统一。如果是目录那么就用正常的目录形式,如果是文件那么就用文件形式。当用户或Spider访问www.domain.com/abc时,部分服务器发现网站根目录下没有abc这个文件,那么就会报404错误,也可能会自动301或302跳转到www.domain.com/abc/上,也有部分服务器是两个URL都可以正常访问的。不论服务器使用哪种处理方式,站长和东莞seo人员最好都要保持站内URL的统一,不至于内链和外链都被分散到两种URL上去。因为百度指不定会在排名中使用哪个版本的URL。另外,目录URL和目录首页文件的URL也有同样的问题,同样需要网址规范化,做好301及站内只使用一个版本的URL,例如www.domam.com/abc/和www.domain.com/abc/index.html。
《百度东莞搜索引擎优化指南》中对于网站URL的建议如下。
(1)网站中同一网页只对应一个URL,如果网站上多种URL都能访问同样的内容,会有如下危险:
-搜索引擎会选一种URL为标准,可能会和正版不同;
·用户可能为同一网页的不同URL做推荐,多种URL形式分散了该网页的权重。
如果你的网站上已经存在多种URL形式,建议按以下方式处理:
·在系统中只使用正常形式URL,不让用户接触到非正常形式的URL;
·不把Session ID、统计代码等不必要的内容放在URL中;
·不同形式的URL,301永久跳转到正常形式;
·防止用户输错而启用的备用域名,301永久跳转到主域名;
·使用robots.txt禁止BaiduSpider抓取你不想向用户展现的形式。
(2)让用户能从URL判断出网页内容以及网站结构信息,并可以预测将要看到的内容。
以百度空间为例,URL结构中加入了用户ID信息,用户在看到空间的URL时,可以方便的判断是谁的空间。URL结构中还加入了Blog、Album等内容信息,用户可以通过URL判断将要看到的内容是一篇博客,还是一个相册。
(3) URL尽量短。
长长的URL不仅不美观,用户还很难从中获取额外有用的信息。另一方面,短URL还有助于减小页面体积,加快网页打开速度,提升用户体验。
例子中的第一个URL,会让用户望而却步,第二个URL,用户可以很轻松地判断是贴吧中关于百度的吧。
(4)正常的动态URL对搜索引擎没有影响。
URL是动态的还是静态的对搜索引擎没有影响,但建议尽量减少动态URL中包含的变量参数,这样既有助于减少URL长度,也可以减少让搜索引擎掉入黑洞的风险。
(5)不添加不能被系统自动识别为URL组成部分的字符。
上面例子中,URL中加入了“;”、 “,”等字符,用户在通过论坛、即时通信工具等渠道推荐这些URL时,不能被自动识别为链接,增加了用户访问这些网页的困难度。
(6)利用百度提供的URL优化工具检查。
百度站长平台提供了URL优化工具,可以帮助检查URL对搜索引擎的友好程度并提出修改建议。