站内优化的两个重要观点

网络营销评论58

在站内优化中,各个方面都值得进行深入的研究,也有很多细节和技巧需要慢慢总结和学习,多多研究竞争对手网站和行业内公认东莞seo做得比较好的网站。当然,在注重东莞seo本身的同时,不要忽略了内容和资源的积累,没有内容和资源,只为了东莞seo而做东莞seo的网站,在搜索引擎上一般都不会走得太长远。笔者对于网站页面和东莞seo有两个小观点,放到本章最后讨论一下。

站内优化的两个重要观点-图片1

通常进行网站分析的时候,往往会把站内网页分成首页、频道(子域名)首页、目录页、目录分页、专题页、聚合页、聚合页分页、内容页、内容页分页、以及索引页(导航页)等类型来进行专门的分析和设计改动建议。其实宏观来看,所有网站都只有两种类型的网页:内容页和聚合页。

内容页是具体的信息页,是网站的根本,也是用户真正需要的页面;而其他页面实际上都是通过对内容页的聚合,按照一定的规则把内容页中的部分内容和内容页的链接聚合到一个页面上,按照URL层级设计、页面内容及链接布局,分出了以上所提到的内容页之外的其他各类页面。或搜索聚合,或标签聚合,或格式化数据聚合,或属性聚合,或专题化聚合。在数据库中看,内容页会有很多属性和标签,这些属性和标签就为“聚合”提供了便利条件。分类目录页、TAG聚合页、专题页等都是根据内容的单一属性或标签进行的聚合;网站首页和频道首页是对内容进行了多属性和标签的聚合,只是为每个属性或标签单独设立了一个数据调用模块。在这些聚合中处处都透露着“站内搜索”的影子。

使用这种观点来看待网站,应该会把东莞seo工作简单化一些。传统分析网站会从首页到内容页进行顺序分析,其实完全可以从内容页到首页进行逆序分析,这样就简单地把整站网页划分成了内容页和聚合页两类,只是内容页之间、聚合页之间由于内容、主题的不同使用了不同的网页模板而已。

既然除了内容页之外都是聚合页,那么站内东莞seo相对就容易研究了。比如在常见的页面类型中,研究除了内容页之外哪类页面是最容易获得搜索排名的,这类页面本身从URL设计、关键词定位、内容布局、对内容页的聚合方式、内链设计及外链获取上相对于其他类型的聚合页面有什么优势等问题。如果你可以明确地得到这些问题的答案,那么你就找到了一个小的东莞seo方向,至少可以把你发现的这种东莞seo优势运用到其他类型的聚合页面中去,而使其他类型的聚合页在搜索引擎中也得到一定的提升。

站内优化的两个重要观点-图片2

例如现在很多大中型网站都会制造一些TAG页面,以内容集合的形式获取更多的搜索流量。由于关键词质量控制不严格,或网站本身内容不给力造成很多网站使用这种操作方法不成功,或收录不好,或排名不好,甚至有的还遭到了百度的严厉降权。按照以上思路TAG页是聚合页,网站的传统目录和专题页也是聚合页,只是模板不同而已,那为什么网站的目录页和专题页就可以获得良好的收录和排名,TAG页就如此不堪呢?此时就需要挖掘一下网站目录页和专题页的特点和优势,并把这种优势也融入到TAG页的设计中去。

比如目录页和专题页一般都有比较短的URL,甚至会直接放到主域名下;目录页和专题页一般都有比较丰富多样的内容,用户到达该页面后会有很多相关选择,跳出率会比较低;目录页和专题页一般会有丰富的内链甚至外链,内容页会通过面包屑自动为目录页添加链接,编辑也会在相关内容页中添加专题页的链接等。

反过来研究TAG页是否也拥有这些优势呢?如果没有,就可以从这几方面改进了。也可以TAG页分配比较短且比较靠近主域的URL;可以通过对站内多种内容的不同形式的聚合来丰TAG页的内容,甚至可以根据不同TAG词的词性做成不同模板的“专题页”;可以通过人工为内容打标签、.让技术配合使用中文分词和TF-IDF自动为内容打标签、直接为内容中的TAG词添加链接等方法来为TAG页增加内链。

关于外链,由于TAG词数量太多,所以不可能为每个TAG词都导入外链,但TAG词之间也肯定会通过站内搜索相关或语义相关,甚至按照数据库ID顺序平铺推荐的方式进行内部推荐,此时只需要按照一定的规则提取出部分有代表性的TAG词,如果结构上为这些TAG词导入外链可以惠及绝大部分TAG页面,那就为这些TAG词专门导入外链就可以了。这些工作中会涉及很多的细节设计、效果试验及质量评测,这里只是提供一个思路供大家参考。

前面提到这些类页面都没有严格的模板,站长把它们设计成什么样它们就是什么样。比如WordPress博客的首页就是内容列表页,如果后台配置每页只显示一篇文章,那么博客首页就是文章内容页。也没有哪儿规定网站列表页就是一列列内容页标题+链接的陈列,站长完全可以把列表页的首页设计成其他的模样,只要用户体验OK就可以了。当然为了使用户和Spider方便地浏览全站内容,目录或列表的分页还是可以保留通用样式的。以上只是举例说明所有类型的网页都没有死板的表现形式,完全可以任意使用用户能够接受的形式,并不表示以上改动一定会如何。关于聚合,大家可以多关注一下美丽说,能直观地看出这是一个由各种聚合页组成的网站,并且没有传统导航、没有面包屑,“聚合”中的页面质量、内链搭建和技术细节有很多可以研究的内容。

站内优化的两个重要观点-图片3

另外,“聚合”只是一种表现形式而已,东莞seo如果只关注关键词库及聚合本身就有些肤浅了。站在东莞seo的角度,要考虑到网站实际内容量和内容类型,以及关键词库的质量和词性分类等,站在网站运营和用户需求角度考虑的就是数据的二次萃取和挖掘了。网站内容繁多,把用户最需要、最有价值的内容挖掘出来,以什么样的形式呈现给用户,这才是需要更深入研究的。东莞seo不要只停留在关键词和内容简单聚合的表层,还需要尝试着深入研究一下自身网站用户的直接、横向和纵向需求,以尽可能符合用户需求、尽可能丰富的形式为用户提供一种有价值的“聚”。

有不少东莞seo人员把东莞seo理论了解得很熟,但是一旦接触到拥有复杂网页类型的网站时就会迷惑,不知道如何下手。希望这个把网站内的页面抽象成内容页和聚合页两类网页的逆向思维观点,能够帮助一些基础东莞seo人员理清站内优化的思路。

在此简单介绍一下TF-IDFTF-IDF其实是TF*IDF,是一种用于数据挖掘和信息搜索的常用加权计算框架。TF为词频(Term Frequency),指的是指定字符在指定文档中出现的次数;IDF为逆文档频率(Inverse Document Frequency),是指定字符在整个文档集合中出现频率的一个相关数值,频率越大,IDF值越小;频率越小,IDF值越大。

对于指定关键词,在指定文档中,往往词频越大的关键词越能反映文档的主题;在指定文档集合中,往往关键词出现在越多文档中,就越不具有区分性和重要性,比如“我”“的”等。这样TF*IDF就可以比较客观地反映出指定文档的特征主题关键词了,指定文档集合中的指定文档中TF*IDF值越大的关键词越能代表该文档的主题,TF*J1)F值越小的关键词越代表和该文档主题不相关。

另外,TF*IDF只是一个计算框架和模型,具体的计算方式会有很多,具体的就需要技术人员去搞定了。在经过大量试验确保效果良好后,东莞seo方面一般会提取单篇文档中TF*IDF值最大的3-5个关键词作为该文档的主题关键词,或为内容页智能打标签,或做内容之间的相关推荐等。关于TF-IDF更多的介绍和细节,大家可以多阅读一些网络资料或和技术人员进行深入的交流。

在此有必要提及的是,针对“聚合”类的网页,LEE201396日发布了一篇《不相关静态搜索结果页将被严厉处理》的公告,公告核心内容如下:

百度网页搜索反作弊团队近期发现一部分网站遍历热门关键词生成大量的站内搜索结果页来获取搜索引擎流量,其中存在大量的不相关内容严重损害了搜索引擎的用户体验并且侵占了相应领域的优质网站收益,对于此类网站我们将做出严厉的处理,希望存在此问题的站长及时进行整改调整。

站内优化的两个重要观点-图片4

在LEE发布公告后,笔者与LEE有过几句简单的交流,LEE表示这次打击的都是明显垃圾的页面,一些垂直或行业网站的站内搜索页面其实质量很不错,并不在打击范围之内。利用词库做TAG聚合页或站内搜索页来抢夺搜索流量的现象已经存在很久了,百度官方也不止一次在不同场合声明这是明显的作弊行为,并且将会打击这种行为。但聚合页和站内搜索页本身的存在是没有问题的,也是顺应用户的需求而产生的,那为什么今天会有如此之多的网站所制作出来的聚合页或站内搜索页就沦落被百度搜索专门列为打击对象了呢?笔者简单总结了一下原因:

1.关键词本身规范问题

部分网站不区分关键词的类型,都直接导入站内,使用统一的模板生成页面。比如有些网站会硬性把“电磁炉”“电磁炉图片”“电磁炉品牌”等词导入站内生成统一的搜索页面,但是搜索页面中只有内容的标题和发布时间,只是简单搜索,并没有给用户呈现“图片”“品牌”的相关内容。当网站中这种杂词量级达到一定程度,宏观上看,整个类型的页面都是垃圾页,它只是为了骗取搜索流量,并没有为搜索用户提供相应的内容,严重降低了搜索结果的质量,这种行为影响比较大且必然会受到搜索引擎的专项打击。

2.关键词和网站之间的相关度问题

部分网站不分析关键词和网站之间的相关度,什么词都敢向站内导,比如手机网站可能导入一些房产、旅游关键词,旅游网站可能导入一堆美容、汽车或者工业关键词等,甚至有些正规内容网站导入了“买卖新娘~‘济南人妖”等完全不搭边的关键词。网站本身的定位和这些关键词不搭边,网站内就更不可能有相关内容了,无论通过什么手段做出来的页面,质量都不会好到哪儿去。这类页面必然会被搜索引擎排斥和打击。

3.关键词数量和网站内容量平衡关系

部分网站所收集处理的关键词类型及关键词和网站内容相关性都比较好,但是没有事先检查网站的内容量是否足以支撑这些关键词。比如有的网站只有5W的内容,但是却导入了100W的关键词,即使关键词质量再好、关键词和网站主题再相关,用SW的内容去整合出100W的页面,那么这些页面如果不是空页面(搜不出内容),宏观来看就肯定有大量重复页面。从而导致整个类型的页面也都是垃圾页面,受到搜索引擎的打击。

4.站内搜索质量问题

有些网站可能把以上问题都解决了,在放出关键词之前也做了一步确定工作,确定用该关键词能搜出相关内容。但是网站站内搜索质量太差,导致所有聚合TAG或站内搜索页的内容和关键词本身很不相关,这并不是什么特殊的问题,大部分网站都会存在这个问题,“搜索”是一件很难的事儿,百度做了这么多年搜索,搜索结果还经常被大家吐槽,更何况其他非专业搜索公司做的“搜索”了。但是既然想用“搜索”做一些事儿,那就要保证最起码的搜索质量,不要搜索“会计培训”而给出一堆“小吃培训”“Java培训”之类的内容。大部分网站如果自己没有比较强的技术团队,也没有第三方比较强的搜索技术支持,站内搜索结果的质量都不会很高,从而建立在低质站内搜索技术基础上的TAG和站内搜索页的质量也就不敢恭维了。由此做出的相关类型的页面也就可以被归到垃圾页面的行列中了。

常见的垃圾聚合页和站内搜索页产生的原因基本是以上这4种之一,有些网站的确是用户搜索行为而产生了大量质量低下的搜索结果页,但网站没有做好审核,就把这些页面全部开放给了搜索引擎。其实这种被动原因和以上几个主动原因的结果都是一样的,在搜索引擎眼中并没有什么区别(在本书第12章中还会提到一些行业的推广人员专门利用有权重网站的站内搜索设置进行暴力推广)。在了解到常见原因后,如果东莞seo人员还是想利用聚合或站内搜索做一些事情,那么一定要在保证避免出现以上情况的前提下进行操作,否则可能会受到搜索引擎的处理,甚至导致整个网站受到惩罚。

其实如果东莞seo人员真的能够从用户需求的角度来设计获取搜索流量的产品,根本就不会产生以上这类页面,这样的产品和网页是不可能获得任何一个负责任PM的支持的。之所以有很多网站会存在这类页面,是因为东莞seo人员充当了PM的角色,把东莞seo做得太“东莞seo”了,完全没有站在用户、资源、产品和运营的角度进行思考。

站内优化的两个重要观点-图片5微信号:xjwseo长按、关注站内优化的两个重要观点-图片6站内优化的两个重要观点-图片7

 
胡远丰:打造你的营销系统之营销思维 网络营销

胡远丰:打造你的营销系统之营销思维

昨天的文章写的是打造你的营销系统之系统工具,今天我就来说说营销思维。营销思维分为以下几种:利他思维老师思维测试思维0风险思维利他思维可以理解为先付出、先帮助、先改变,就是说先帮助别人,帮别人解决问题,...
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: