
课件14张PPT。3.1利用网络获取信息内容提要一、因特网信息检索工具的产生背景 二、搜索引擎及其类型 三、搜索引擎的工作过程和原理 四、因特网信息检索工具的使用技巧 五、因特网信息检索工具的发展趋势一、因特网信息检索工具的产生背景进入20世纪90年代,伴随着因特网的飞速发展,网上的信息资源日新月异,呈爆炸式增长。面对因特网上无穷无尽的数字化、多媒体、跨时空、跨语种的信息资源,普通网络用户想找到所需的资料简直如同大海捞针,这时,满足网络用户信息检索需求的因特网信息检索工具便应运而生了。二、搜索引擎及其类型1、狭义:搜索引擎(search engine)是指对因特网上的站点资源和其他网络资源进行标引和检索的一类检索系统机制,由信息收集软件、索引数据库和查询接口三部分组成。 2、广义:搜索引擎是指因特网上的一类网站,它们在万维网中主动搜索信息,搜索网页上有意义的单词和简短的对特定内容进行描述的词,并将其自动标引的万维网网站以及标引的内容储存在可供检索的大型数据库中,并建立相应的索引和目录服务,从而对用户提出的各种检索要求作出响应,提供用户所需的信息或相关的链接。二、搜索引擎及其类型3、搜索引擎按其检索机制主要可分为三种:全文搜索引擎、目录搜索引擎和元搜索引擎 (1)全文搜索引擎:通过用户输入关键词来查找所需的信息资源。 主要代表:Google、AltaVista、百度等。 优点:全文检索;检索功能强;信息更新速度快。 缺点:提供的信息太多而降低了搜索的命中率;查询的结果中重复链接多,层次结构不清晰。二、搜索引擎及其类型(2)目录搜索引擎:把搜集到的信息资源按照一定的主题进行分类,建立层次目录。 主要代表:雅虎、搜狐、新浪、网易等。 优点:层次结构清晰,易于查找;多级类目,便于找到具体明确的主题;分类目录下有简明扼要的内容,一目了然。 缺点:搜索范围较小;更新速度慢;查询交叉类目时容易遗漏。 (3)元搜索引擎:又称为集成型搜索引擎,是将用户的检索请求同时送到多个引擎上进行搜索,并将结果返回给用户。 主要代表:MetaCrawler、Ask、Dogpile等。 优点:用户只需提交一次查询请求,就可以查询多个搜索引擎,大大提高了检索效率。 缺点:没有自己独立的搜索引擎,受其它搜索引擎的影响。三、搜索引擎的工作过程和原理搜索引擎一般都由信息搜索系统、索引数据库和查询接口三部分组成。 1、搜索引擎的工作流程 (1)由信息搜索系统在因特网中发现、搜集网页信息; (2)对信息进行提取和组织,建立索引数据库; (3)根据用户输入的查询条件,在索引数据库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。 注意:任何搜索引擎都是检索引擎数据库中的数据,而不是各网站上的具体内容。 三、搜索引擎的工作过程和原理2、搜索引擎的工作原理 (1)全文搜索引擎 全文搜索引擎主要采用关键词索引技术,其索引程序生成从关键词到超文本链接的索引表。不同的搜索引擎系统可能采用不尽相同的标引方法。 三、搜索引擎的工作过程和原理2、搜索引擎的工作原理 (2)目录搜索引擎 目录搜索引擎中的信息收集系统主要是由人工完成,搜索引擎的标引专家依靠手工来搜寻不断出现的新网站,给每个网站一个标题和大概的描述,将其放入相应的类目体系中。这些类目在页面上表现为每个类目路径下排列着相关的网站,也称为目录导航。三、搜索引擎的工作过程和原理2、搜索引擎的工作原理 (3)元搜索引擎 元搜索引擎一般没有自己的数据库和“蜘蛛”程序,而是以一个代理的角色,接受用户的查询请求。它只是提供了一个统一的界面,把多个具有独立功能的搜索引擎组合起来。使用元搜索引擎,用户只需提交一次查询请求,就可 ... ...
~~ 您好,已阅读到文档的结尾了 ~~