数字信息资源检索原理-EI检索课外杂谈
计算机系统中的数字信息检索就是指人们在计算机和计算机检索网络或终端上,使用特定的检索指令、检索词和检索策略。从计算机检索系统的数据库中检索出所需耍的信息,然后再由终端设备显示和打印的过程。计算机检索是以计算机为墓础的信息的存储与枪索.是在人和计算机的共同作用下去完成信息存取操作.从而迅速、准确地给用户提供符合特定需耍的信息的一种方法与过程。
为实现这种信息枪索,必须事先将大量的原始信息加工处理、存储在各种信息载休上待用.所以计算机信息检索广义上讲包括信息的存储和检索两个方面。
信息存储的过程就是将所选中的一次文献进行主题分析、标引和著录.按一定格式物人计算机.构成机读数据库记录及文献特征标识.为枪索提供经过整序(即形成检索途径)的信息集合的过程。在存储文献时,文献信息标引人员要进行信息的标引和著录。信息的标引就是对文献信息的内容进行主题分析.使之形成若干能反映文献信息主题的概念,然后借助于检索语育(分类法、主题词表等)把这些概念转换成检索词汇,形成检索标识,如给出分类号或主题词的过程。所谓信息的著录是按照一定的规则对信息的外部特征和内容特征加以简单明确的表述(信息外部特征包括信息的著者、来源、卷期、页次、年月、号码、文种等,信息内容特征包括题名、主题词和文摘)。然后把这些经过“前处理”的数据按一定格式输人计算机存储起来,计算机在程序指令的控制下对数据进行处理,形成机读数据库,存储在存储介质(如磁带、磁盘或光盘)上,最后形成称为检索工具的检索体系《印刷型/电子型》.完成信息的加工存储的过程。(本文由www.ei-istp.com整理提供)
信息检索则是存储的逆过程。检索人员对检索课题加以分析,确定所需信息的实质内容,形成主题概念.然后借助各种检索语育,把主题概念转换成检索词汇,并按实际需求把这些词汇之间的逻辑关系表达出来.形成检索表达式。从用户提问进行主题分析到枪索表达式形成的这一过程,就是编制检索策略的过程。如同把存储阶段形成的标引记录看成是信息著录一样.也可以把检索阶段形成的检索表达式看成是用户提问著录。两种著录的区别在于,前者的著录结果是对信息内容和形式特征的逐一记录,而后者的著录结果所表达的各主题概念之间通常含有逻辑性。检索表达式形成后,即可输人到计算机进行查找。这一查找的过程实际上是计算机自动比较、匹配的过程,当枪索标识、枪索策略与数据库中的信息的特征标志及其逻辑组配关系相一致时,则属“检索命中”,即找到了符合要求的信息。在手工检索过程中.相符性的比较是由人脑进行的.而在计算机检索过程中,则由计算机担负两者间的匹配工作。至此一个具体的信息检索过程结束。计算机检索的基本原理如图1-1所示。
本文由EI检索 www.ei-istp.com 整理