首页 理论教育 详解信息检索的实现过程

详解信息检索的实现过程

时间:2023-07-23 理论教育 版权反馈
【摘要】:显而易见,信息检索系统是信息存储和信息获取的物质纽带,存储为检索提供基础,而检索正是存储的目的所在。主要指依据信息自身的特征对其进行加工,比如题名、著者、出处、关键词、内容特征等,并将这些字段提炼成可以替代该信息的词条。即是对上述著录信息进行整序标引,将所有替代信息按其标识进行有规律的组织排列,形成可检索的信息源集合。

详解信息检索的实现过程

图2.1 信息检索系统工作流程

我们在明确了信息检索重要作用的同时,可能会想到为什么信息检索能有这么强大的功能?这些信息是怎么来的?为什么在一个简单的搜索框里输入词语之后就能返回这么多结果?而且还都是符合需要的呢?这里就需要引入信息检索得以实现的基础——信息检索系统。如图2.1所示,整个信息检索过程包括两部分:一是前期的对信息源的加工、组织、排序,并按一定规则存储于检索系统之中,这部分由检索系统的工作人员进行人工操作或计算机程序自动完成;二是信息需求者向检索系统提出检索要求,检索系统按照用户提供的关键词与自己数据库中的标识进行匹配,最终用户从返回的检索结果中提取所需信息,这部分由信息用户完成,也是我们日常所说的信息检索。

显而易见,信息检索系统是信息存储和信息获取的物质纽带,存储为检索提供基础,而检索正是存储的目的所在。那么,信息检索系统是如何对存储的信息进行标引?又是如何读懂信息用户需求的呢?要做到正确传递信息,完成供需匹配,需要做好以下三个环节。(www.zuozong.com)

(1)信息著录。主要指依据信息自身的特征对其进行加工,比如题名、著者、出处、关键词、内容特征等,并将这些字段提炼成可以替代该信息的词条。这里要存储的信息不仅包括原始文档数据,还包括图片、视频和音频等多媒体数据。首先要将这些原始信息进行计算机语言的转换,并将其存储在数据库中,否则无法进行机器识别。

(2)信息标引。即是对上述著录信息进行整序标引,将所有替代信息按其标识进行有规律的组织排列,形成可检索的信息源集合。

(3)信息匹配。用户根据意图输入查询请求后,检索系统根据用户的查询请求在数据库中搜索与检索词相关的信息,通过一定的匹配机制计算出信息的相似度大小,并按从大到小的顺序将信息转换输出。检索词描述得越具体,检索结果越精确。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈

相关推荐