文献检索系统
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
文献检索系统又叫文献情报检索系统,它是检索和提供文献线索、文献地址、文献目录、文献原文或文献复制件的一种常见的检索系统。它是一个使情报用户需要同文献情报源之间相互联系,包含有文献情报资源,具备一定的物质载体与设备,能够提供一定检索技术手段的有机整体。
在文献检索系统中,文献描述体数据库,就是文献检索工具。检索工具虽然是文献著录款目的集合,但它却包含了词表、索引等因素。它是一种有形的实体,总是同一定的载体设备相联系,它必然具备一定的检索手段和潜力,并且总是体现着一定的用途、对象和目标。实际上,检索工具就是检索系统的核心和概括。文献检索系统的种类主要有:
- 书目检索系统。书目检索系统包括传统的文摘、索引和目录、机读目录、联机目录以及提供书目数据库查询服务的系统。
- 全文检索系统。全文检索系统包括传统的缩微检索系统、电子报刊、电子辞书以及能提供其它全文数据库查询服务的系统
- 语段检索系统。以语段作为存贮和检索单元,介于文献检索与事实检索之间。
一个完整的文献检索系统通常包括以下六个方面,即六个子系统:
(1)文献选择子系统,即检索工具对一定学科范围文献的覆盖面,摘贮率,以及对文献类型、文种与时间跨度的包含程度。
(2)词表子系统,即作为文献的存贮与检索两个方面的用来表达文献内容与提问内容的共同依据,词表(包括主题词表和分类表等)的规模(网罗度)与细分程度(专指度),是影响检索工具查全与查准潜力的重要因素。
(3)标引子系统,即根据一定的词表,将文献的主题内容经过概念分析,而翻译(转换)成检索系统语言的词汇。这里,不仅决定文献描述的准确性和信息含量,而且引得深度、标引的一致性也是影响检索效率的因素。
(4)查寻子系统,即把情报用户的需求,经过概念分析,翻译(转换)成检索系统语言的词汇,并指出其逻辑关系的过程,具体来说,就是构造检索策略的过程。
(5)用户与系统之间交互子系统,即通过同情报用户的商谈并收集反馈,弄清用户的真实情报需求,形成明确的检索概念,并将其准确地表述出来的过程。这是确定具体检索目标的过程,即决定检索的角度、深度、广度和时间、文种范围的关键一步,也是成功地制定检索策略、实施检索的前提。
(6)匹配子系统,即检索策略同文献索引中的有关标引记录相比较而决定其取舍的过程。情报检索的实质,就是文献特征同情报提问之间的“匹配”。
匹配的各种技术与方法,决定了各种不同的检索方式———如纯手工的检索方式、半机械的检索方式、光电检索方式、电子计算机检索方式等。在计算机情报检索的条件下,机器的功能与程序的质量是衡量匹配效率的根据。由于文献信息量大,属性复杂多样、连贯性强,故文献检索系统中信息存贮通常采用非定长的文件方式。每篇文献用单一的独立记录来描述和表示,并需要建立多种索引结构,以支持系统对提问作出迅速的响应。
任何文献检索系统的物理构成都可以分解为以下三个部分:
(1)硬件。算机及其外部设备,通讯设施;或是卡片穿孔机,分类机;缩微照相机和阅读机;或是其它用于文献加工、存贮和报道的设备。
(2)软件。计算机系统的软件和应用软件,检索软件;标引方法,标引专家;检索技术,检索专家。
(3)文献库。机读文献磁带、磁盘,联机文献库,光盘数据库;或是载有文献信息的缩微品,穿孔卡片集合,卡片式目录,书本式检索工具。
综合指标检索效率是指在特定的检索系统、数据库中按一定的检索策略进行检索所获得的检索结果的综合指标。人们在进行科技情报检索时,往往不能如愿,这是因为大多数检索工具或检索系统,目前只处理文献标志,但文献标志只表示文献的中心主题,而不是表示文献的次要主题。因此检索工具或检索系统只能回答情报提问而不一定能满足用户的情报需求。另外,一般的检索者只能大概地表述自己的情报提问,而不能确切地衡量文献与提问的切题程度。并且检索课题性质、范围、深度往往不断变换;查找文献的方法尚未形成固定模式;词表质量仍存在问题;人们的知识面存在一定局限等。正因为存在上述原因,文献标引与检索失误就不可避免。
检索效率的测评有助于发现检索系统的缺陷及其原因,提高资源分配的合理性,改进系统的性能和服务质量,优化新系统的设计,丰富情报检索的理论和技术。
检索效率是对检索结果的评价,评价的标准不尽统一,具体来说,包括检索扫描范围的完整性、查全率、查准率、新颖率、检索响应时间、用户负担、检索结果输出方式的灵活性等。
(1)检索扫描范围的完整性。指数据库(或书本式检索工具书)所录文献数据的完备程度、摘贮率、每条记录(书目引文等)的信息含量。
(2)查全率。指数据库中事实上存在的相关记录、其中被检出的百分比。它是衡量系统检出相关文献的能力。用公式表示为:
查全率=(被检出的相关文献量÷检索系统中所有相关文献量)×100%
查全率的反面是漏检率。在检索过程中,未检出的文献当中可能存在少量相关文献,此部分文献叫漏检文献,它与检索系统中所有相关文献量的百分比即为漏检率,其公式为:
漏检率=(未检出的相关文献量÷检索系统中所有相关文献量)×100%漏检率可作为衡量检索效率的参数。
(3)查准率。指被检出的文献(记录)中,其中被鉴别为是查准了的百分比。它是衡量系统拒绝不相关文献的能力。其公式为:
查准率=(被检出的相关文献量÷被检出的文献量)×100%查准率的反面是误检率。在检索时,在检出的文献当中可能会夹杂着不相关的文献,那么此部分文献叫误检文献,它与被检出的文献量的百分比即为误检率。其公式为:
误检率=(被检出的不相关文献量÷被检出的文献量)×100%误检率也可作为衡量检索效率的参数。
(4)新颖率。指被检出的文献(记录)中,用户在检索前未掌握的资料的百分比。这在一定程度上反映了数据库(检索工具书)的时差及更新周期的长短。它是衡量检索系统提供信息及时性的一种测度。
(5)检索响应时间。指用户输入检索式至获得检索结果的时间之长短。它在一定程度上反映了检索系统的检索匹配速度及其所采用的检索算法。
(6)用户负担。指用户取得一定检索结果的经济负担,以及构造检索策略时的智力负担。前者反映了检索系统运行的成本与收费水平,后者反映了检索系统的易用性及对用户帮助的水平。
(7)检索结果输出方式的灵活性。指检索系统能否提供显示、打印、套录、按指定字段输出以及检索结果排序的多种选择。
确定评价对象与目的;选择评价方式;设计评价方案;实施评价;评价结果的分析与解释;改进系统的性能与效益。
(一)提高检索效率的途径
提高检索效率是国内外研究与使用各种检索方法与检索装置的主要目的,即在客观条件允许的范围内尽可能查得全;查得准,以求达到最佳的检索结果。要提高检索效率应从以下两方面着手。
(二)提高检索工具的质量
检索工具的质量是影响检索效率的客观因素。一般来说,检索工具搜罗文献的数量越多、引得的深度越大,即文献的检索标识数目越多,查全率越高。如果一篇文献在检索工具中只有一个标目,那么它在检索工具中就只有一个位置。如果通过分析、互著、参见等方法,使它得到多次反映,那么从各个角度检索到的可能性就增大。由此可见,引得深度的提高,意味着文献被检索到的比率的提高。它是检索工具编制工作的重要质量指标。另一方面,检索语言的专指度越高,即表达概念的外延越小,查准率越高。因此,要提高检索效率,就必须提高检索工具质量,而要提高检索工具质量,就必须在文献的数量、引得的深度、检索语言的专指度上下功夫。
(三)提高检索人员的素质水平
检索人员的素质水平是影响检索效率的主观因素。检索者在检索过程中的每一步骤和所作的安排和部署,包括选择检索的工具、方法、途径等,均取决于检索者的专业知识、文献知识和检索技能。如果检索人员的素质水平高,就会通过最便捷的途径获取自己所需文献,达到事半功倍的效果。如果检索人员素质水平低,在检索过程中误入歧途的可能性就大,从而导致检索效率低的结果。因此,提高检索人员的素质水平,是提高检索效率的关键。
- 李辉.文献检索系统及检索效率评价指标分析[D].科技创业.2012