选择检索词.构建检索表达式
检索表达式。概括地说,就是检索策略的逻辑表达式,是指计算机信息检索用户用来表达检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位算符及系统规定的其他组配连接符号组成。从某种惫义上讲.检索式是检索策略的具体体现.它的质是高低,将关系到检索策略的成败;而检索式的质盆,则取决于对情报提问的主题概念是否有正确全面的逻辑分析.取决于是否选全选准了检索词及是否能合理运用各种连接组配符号对检索项进行组配。
检索词是编制检索式的物质基础.是表达用户信息需求的检索提问式的基本元素.也是计算机信息检索系统中有关数据库进行匹配运算的基本单元。在计算机信息检索系统中,检索词除了表示文献信息形式的题名、若者、出处等外部特征
外,基于文献信息内容特征的检索词可分为受控词和非受控词两大类。
受控词是一种事先规范化的诸言,它们取自主题词表、叙词表、分类表等。使用受控词作为级基本的检索词进行联机检索,其主要优点是能容易地选择宽度适当的概念.另一个优点是用户检索时相对容易.大大节省了联机时间.因为在标引
文献时.标引员已事先解决了自然语言中的同义词、近义词的关系.并在词表中显示了词与间之间的相互关系。因此,在选择检索词时,若用户所选的数据库具有机读式或印刷本的主题词表,则一般总是优先选用受控词,这样,可以使检索提问标识和文献特征标识相一致.获得最佳检索效果。
由于受控词涉及的概念数A有限,受控冈表的收词数a有限。加之结构复杂.有时已不能适应数t众多、要求各异的检索用户的情报需求,因此,出现了采用非受控词的自然词汇枪索方法。
白然词汇是指未经规范处理的词或者词组.包括关键词和自由词,直接取自文献信息本身。关键词是文献箱名、摘要、正文中出现的具有实质竞义的表达文献主题内容的词。自由词是指在枪索时估计文献中可能出现、具有检索惫义.未被词表
收录的词.该同可以实现全文信息查找。使用自然词汇检索时.字面匹配则表示命中.由于自然词汇往往一词多义.很容易产生误检.因此,在检索时要尽A做到概念匹配。
选择检索词一般要从以下几个方面进行考虑。
(1)”对枪索课题进行科学正确的主题分析.将课题内容分解或综合成某些概念。选择核心概念.挖掘隐含概念.排除非核心与宽泛概念.力求这些概念能反映用户信息需求和检索主题内容。
(2)在确定ISTP检索用词时,检索词的教是和专指度要合适.主次分明,一般要遵循优先使用规范词,其次选用关键词.然后再根据文献情况恰当使用自由词的原则。目前.联机检索系统和光盘检索系统一般要求使用系统特定的词表.而绝大多数的网络信息检索工具都支持自然词的检索。
(3)可以随时视检索需要,调整选择检索词.灵活使用多义词、同义词、近义词等。如果想扩大检索范围,选择枪索词时要尽量选择上位概念或者词组;如果想绪小检索范围.则选择专指性强、特定概念或者专业术谙.避免井通词和太泛指的词。
在选择好检索词后,检索人员就需要采用上一节提到的计算机信息检索的技术.构造检索提问式。构造一个准确合理的检索提问式可以极大地提高检索的质盆和速度。
在构造检索表达式的过程中.要注意以下两点。
(1)灵活运用各种运算符号。为了达到理想的检索结果,可以将多种运算符同时使用,以准确表达检索需求的内容。例如.为了扩大检索范围,可以利用截词符、布尔逻辑运算符OR,模糊检索等。如果想缩小检索范围.可使用AND, NOT运算符.使用字段检索限定查找范围;使用梢确检索技术的双引号来提高检索的梢确度;使用各种位置运算符限定检索词之间的位置关系.以提高检索的准确性和灵活性。
(2)准确构造检索提问式。熟悉枪索系统的索引体系、枪索用词规则和运算符的含义,仔细分析检索词之间的逻辑关系.分期分步构造检索表达式。不断修改检索表达式.以期获取最佳、最合理的检索表达式.完整而准确地反映出用户提问
的主题内容。
检索表达式是检索策略的具体体现.构造检索表达式要受到枪索策略的指导和约束。
本文有www.ei-istp.com整理提供