信息检索
出自 MBA智库百科(https://wiki.mbalib.com/)
信息检索(Information Retrieval)
目录 |
“信息检索”一词出现于20世纪50年代 ,又称信息存贮与检索、情报检索,是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息的过程和技术。
也就是说,包括“存”和“取”两个环节和内容。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查询(Information Search 或Information Seek)。
信息检索技术一般是指根据顾客需求,从大规模的相对静止的数据库中检索顾客需要的信息,主要满足顾客瞬时的信息需求。信息检索技术主要用于相对静止的信息存储领域。
(一)按检索对象划分,信息检索可以分为:
- 文献检索
- 数据检索
- 事实检索
以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。
(二)按检索手段划分:
- 手工检索
- 机械检索
- 计算机检索
其中现在发展比较迅速的计算机检索是“网络信息检索”,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
(三)按检索途径划分:
- 直接检索
- 间接检索
(四)按信息载体划分:
- 文献信息检索
- 非文献信息检索
信息检索的特征[1]
网络信息检索是一种基于超文本方式的信息查询工具。其主要特征表现在:
1.分布式特征
网络信息检索以节点为单位组织信息,节点间交叉相联复杂的信息链结构能够按照不同查询条件链结节点信息。信息资源在物理上分散在许多的网络节点上,即“异构平台、异构数据源”。因此,在分布的网络环境下开展信息服务, 要打破由此形成的屏障,实现互联互通。
2.多用户特征
网络时代的信息资源服务对象是多用户的。针对不同用户开展不同服务,就要获取并管理不同用户的个性化信息需求,使信息透过大量的需求模板,主动送到用户的手上。
3.信息丰富特征
网络信息源众多、数据量巨大、信息丰富。其一方面导致了垃圾信息数据的增多,高效信息检索方法尤为必要。另一方面,海量信息可能导致一些软件差错,需要的处理时间也更长。
4.非专业化特征
网络环境下使用信息检索系统的用户大多都不具备专业的信息检索技能。虽然搜索引擎也支持逻辑组合, 但非专业用户更加需求灵活的问答式知识检索、个性化推送等更具智能化色彩的服务。另外,良好的导航能力可以引导用户在复杂的网络信息中漫游不至于迷失方向,从而更有效的利用网络信息资源。
- 信息内容分析与编码,产生信息记录及检索标识。
- 组织存贮,将全部记录按文件、数据库等形式组成有序的信息集合。
- 用户提问处理和检索输出。
关键部分是信息提问与信息集合的匹配和选择,即对给定提问与集合中的记录进行相似性比较,根据一定的匹配标准选出有关信息。它按对象分为文献检索、数据检索和事实检索;按设备分为手工检索、机械检索和计算机检索。由一定的设备和信息集合构成的服务设施称为信息检索系统,如穿孔卡片系统、联机检索系统、光盘检索系统、多媒体检索系统等。信息检索最初应用于图书馆和科技信息机构,后来逐渐扩大到其他领域,并与各种管理信息系统结合在一起。与信息检索有关的理论、技术和服务构成了一个相对独立的知识领域,是信息学的一个重要分支,并与计算机应用技术相互交叉。
信息检索方法包括:普通法、追溯法和分段法。
1.普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。普通法又可分为顺检法和倒检法。顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性强,效果较好。
2.追溯法是利用已有文献所附的参考文献不断追踪查找的方法,在没有检索工具或检索工具不全时,此法可获得针对性很强的资料,查准率较高,查全率较差。
3.分段法是追溯法和普通法的综合,它将两种方法分期、分段交替使用,直至查到所需资料为止。
- ↑ 蒋瑶. 浅谈关于网络信息检索的认识[J]. 大众文艺:学术版, 2010(9):2.