很多站长们在做SEO的时候经常会在写文章的问题上犯愁,都知道原创文章对搜索引擎最友好,最容易被收录,但是现实中又没有太多精力天天写原创文章。下面,合肥SEO优化就为大家讲一下搜索引擎是如何判断网站文章是否原创的,掌握搜索引擎对原创文章的判断标准呢?又将如何有助于我们在做SEO优化的时候提高网站的收录量呢?
资料图
目前,由于搜索引擎对于原创文章的权重比较高,所以很多站长都会自己制作原创文章。所说的伪原创无非就是在原文中进行增加,删除,修改等操作,目的是让搜索引擎认为这篇文章是原创的。那么搜索引擎是如何判断文章原创性?
首先我们明确两个概念:原创与伪原创。原创:这个好理解,就是第一次在网络上公开发表的文章内容。伪原创:就是对原创性内容的进行再次的加工后重新再次发表,当然,伪原创的方法有很多,这里就不多说明。
如果你的伪原创做得好,发表的文章内容同样可以达到原创的效果,同样受到搜索引擎的青睐。那么搜索引擎如何去判别一篇文章是原创还是伪原创呢,一般来讲会从以下几个方面有关联:
这是我纠结了很久的问题,我们在为网站做内容的时候,一些技术性的文章或者是攻略性的文章,是自己写好?还是去采集别人的好?这里采集是指:整合出比较全面的内容,有附加价值,不是全部照搬,下面说说我的看法:
1、自己写的内容很符合搜索引擎所需要的原创性,但自己写的毕竟不是专业,所以写出来的东西根本满足不了用户的需求,而且还不能批量,自己写原创对于搜索引擎自然是好,但对于用户未必是好的,用户需要的是比较专业而且全面的文章,如果自己写绝对做不了这一点。
2、采集别人的内容,常常去看一些文章的时候发现,其实很多的站点文章内容都没有完全满足用户的需求,有的甚至只写了一半,针对这样的文章,如果我把它们全部整合在一起,然后把这些内容附上图片或者放一些大部分用户都需要的东西在里面,也就是把它本身没有的东西全部附加上去。
然后发到自己的网站上去,问题:这样做对于用户肯定是好的,但对于搜索引擎未必是好的,因为我都是采集然后整合出来的,它会不会认为我的文章就是采集的垃圾文章?撇开权重高的网站不说,我只是想讨论针对权重低的网站,这种情况怎么处理。
所以我想知道搜索引擎是如何判断一篇文章是否有价值呢?
并不是你网站有文章,是你自己写的,就一定会被搜索引擎认为这是一篇原创文章,因为其中还有很多技术方面的问题,搜索引擎还未能解决。
记得我以前合肥建网站每天更新一篇文章,一篇文章的字数只有二百字左右,但是文章页面非常简单,简单到整个页面没有代码,只有文字,但收录却非常好,而有一些网站,用代码把网站修饰的非常漂亮,但是发布的文章却不收录,这让我开始觉得代码与原创度有直接关系。
据我认为搜索引擎在抓取一个页面的流程是从头到底,任何一个页面都有一个共同点,那就是头部一样、底部一样,唯一不一样的就是文章内容,那么搜索引擎在抓取头部有一、二段左右是一模一样的,到中部文字的时候只有二、三部分是不一样的,而底部再有一、二段是一模一样的,那么还会认为这是原创文章呢?
这里还得给大家灌输一个理念,那就是搜索引擎是不认识字的,他只有把这个汉字放到他的数据库去对比,当一对比一个新文章页面的时候,比如总共22KB页面,居然20KB一模一样,就算是写了原创文章,也会被列入到伪原创的列表中去。
经过我大半年的SEO优化加测试,我对原创文章的判断得出了这样的一个理论,当一个页面比较大的时候,一个页面的不同点至少占页面的三分之一,那么写多少文字呢,比如你页面有10KB,那么至少的写3KB的文字,剩下的7KB相同,这些才不容易被列入到伪原创的列表中。当然,这是我个人得出的理论,并没有完全的证据和理论来证明。
所以写了这么多,大家可看到了每种判断方式各有优缺点 ,搜索引擎应该也特别希望能做出正确的判断,不过先不说技术问题,光是判断标准就够令人抓狂的了。毕竟搜索引擎只能根据人的命令才运行,如果我们无法给出绝对正确的判断标准,那么搜索引擎也是没法解决这个问题的……
微信公众号 kehuseo
设别二维码关注