2024年6月12日发(作者:)

搜索引擎技术内核

班级:07信管本(2)班

姓名:于振业

学号:45

搜索引擎简介:

搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜

索软件或网络登录方式,将Internet上大量网站的网页信息收集到本地,经过加工处理建

立信息数据库和索引数据库,从而对用户提出的各种检索作出响应,提供用户所需的信息

或相关指针。目前,我国互联网中主要的搜索引擎有Google、百度、Bing、有道、搜狗等

等。百度和Google的用户相对较多。以后还会有更多专业的搜索出现

用户检索途径主要包括:

a.自由词全文检索

b.关键词检索

c.分类检索

- 1 -

d.其他特殊信息检索

搜索引擎的技术性分类:

 全文搜索引擎

全文搜索引擎的“网络机器人”或“网络蜘蛛”是一种网络上的软件,它遍历Web

空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,

从一个网站到另一个网站采集网页资料。它为保证采集的资料最新,还会回访已抓取过的

网页。网络机器人或网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度

算法进行大量的计算建立网页索引,才能添加到索引数据库中。我们平时看到的全文搜索

引擎,实际上只是一个搜索引擎系统的检索界面,当你输入关键词进行查询时,搜索引擎

会从庞大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排名规则呈现

给我们。不同的搜索引擎,网页索引数据库不同,排名规则也不尽相同,所以,当我们以

同一关键词用不同的搜索引擎查询时,搜索结果也就不尽相同。google、百度等等。

 目录索引搜索引擎:

目录索引搜索引擎中的数据是各个网站自己提交的,它就像一个电话号码薄一样,按

照各个网站的性质,把其网址分门别类排在一起,大类下面套着小类,一直到各个网站的

详细地址,一般还会提供各个网站的内容简介。

用户不使用关键字也可进行查询,只要找到相关目录,就完全可以找到相关的网站(注

意:是相关的网站,而不是这个网站上某个网页的内容)。这类搜索引擎往往也提供关键字

查询功能,但在查询时,它只能够按照网站的名称、网址、简介等内容进行查询,所以它

- 2 -