探寻蜘蛛和机器人

网络营销评论68
探寻蜘蛛和机器人-图片1

搜索引擎要知道网上的新生事物,就得派人出去收集,每天都有新的网站产生,每天都有网站内容的更新,而且这些产生的网站数量、更新的网站内容是爆炸式的,靠人工是不可能完成这个任务的,所以搜索引擎的发明者就设计了计算机程序,派它们来执行这个任务。探测器有很多叫法,也叫 Crawler(爬行器)、spider(蜘蛛)、robot(机器人)。这些形象的叫法是描绘搜索引擎派出的蜘蛛机器人爬行在互联网上探测新的信息,Google 把它的探测器叫做 Googlebot,百度就叫 Baiduspider,Yahoo 称为 Slurp,无论它们叫什么,它们都是人们编制的计算机程序,由它们不分昼夜的访问各个网站,取回网站的内容、标签、图片等,然后依照搜索引擎的算法给它们定制索引。

探寻蜘蛛和机器人-图片2

网络蜘蛛通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。

当抓取到这些网页后,由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在 URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

建立网页索引数据库后,当用户输入关键词搜索,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后,由检索器将搜索结果的链接地址和页面内容摘要等内容组织起来,返回给用户。

探寻蜘蛛和机器人-图片3

探寻蜘蛛和机器人-图片4

长按二维码识别关注我们

 
awk数据处理工具 网络营销

awk数据处理工具

awk数据处理工具 awk:是一款功能非常强大的数据处理工具,是一种用于文本处理的编程语言工具,如果对其进行详细介绍,完全可以写一本书了,在此我们只是简单了解一下它的初级应用,这款工具在东莞seo的日...
域名解析出错的解决办法 网络营销

域名解析出错的解决办法

第一:分析网站是否域名设置错误由于目前域名解析服务很多都是由域名供应商来设置,当然也有的用户在网站运营期间需要更改一些选项,导致网站域名解析出现故障。如果网站打不开,那么就需要通过软件进行分析,发现是...
什么是meta标签,为什么meta标签那么重要? 网络营销

什么是meta标签,为什么meta标签那么重要?

当谈到标签对于网站关键词排名优化的影响时,很多人都存在误读。甚至包括一些做网站的公司。我曾经去一些企业给客户做网站诊断,知道依然有很多用户不懂,做网站的公司半知半解而导致做好的网站无法正常的上线运营,...
匿名

发表评论

匿名网友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: