搜索引擎的工作原理是什么?

原创 大王  2018-07-23 23:04  907人阅读

先来了解一下什么是搜索引擎:搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

一个搜索引擎由搜索器 、索引器 、检索器 和用户接口 四个部分组成。搜索器的功能是在互联网 中漫游,发现和搜集信息。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档 以及生成文档库的索引表。检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。

搜索引擎的工作原理

搜索引擎工作原理分为4步
  1. 抓取网页,搜索引擎排除爬虫(蜘蛛),从一个网站爬到另外一个网站,通过超链分析访问并抓取更多的网页。
  2. 过滤,所有抓取到的网页会存放到一个临时的库中,通过过滤,把质量高的页面存放在索引库中,质量低的页面存放在底层库中。
  3. 收录并建立索引,搜索引擎把抓取过来的页面进行精细化的整理,通过页面分析、切词分词、建立倒排索引,最后再入库写库。
  4. 排名-结果呈现,影响排名的因素:网站定位、网站结构、网站布局、网站代码、网站内容、用户忠诚度、外链推广等等。网页经历了抓取建库,参与排序计算,最终展现在搜索引擎用户面前。
本文地址:http://www.dawangseo.com/baike/52.html
版权声明:本文为原创文章,版权归 SEO学习网 所有,欢迎分享本文,转载请保留出处!

发表评论


表情