信息檢索
出自 MBA智库百科(https://wiki.mbalib.com/)
信息檢索(Information Retrieval)
目錄 |
“信息檢索”一詞出現於20世紀50年代 ,又稱信息存貯與檢索、情報檢索,是指將信息按一定的方式組織和存儲起來,並根據信息用戶的需要找出有關的信息的過程和技術。
也就是說,包括“存”和“取”兩個環節和內容。狹義的信息檢索就是信息檢索過程的後半部分,即從信息集合中找出所需要的信息的過程,也就是我們常說的信息查詢(Information Search 或Information Seek)。
信息檢索技術一般是指根據顧客需求,從大規模的相對靜止的資料庫中檢索顧客需要的信息,主要滿足顧客瞬時的信息需求。信息檢索技術主要用於相對靜止的信息存儲領域。
(一)按檢索對象劃分,信息檢索可以分為:
- 文獻檢索
- 數據檢索
- 事實檢索
以上三種信息檢索類型的主要區別在於:數據檢索和事實檢索是要檢索出包含在文獻中的信息本身,而文獻檢索則檢索出包含所需要信息的文獻即可。
(二)按檢索手段劃分:
- 手工檢索
- 機械檢索
- 電腦檢索
其中現在發展比較迅速的電腦檢索是“網路信息檢索”,也即網路信息搜索,是指互聯網用戶在網路終端,通過特定的網路搜索工具或是通過瀏覽的方式,查找並獲取信息的行為。
(三)按檢索途徑劃分:
- 直接檢索
- 間接檢索
(四)按信息載體劃分:
- 文獻信息檢索
- 非文獻信息檢索
信息檢索的特征[1]
網路信息檢索是一種基於超文本方式的信息查詢工具。其主要特征表現在:
1.分散式特征
網路信息檢索以節點為單位組織信息,節點間交叉相聯複雜的信息鏈結構能夠按照不同查詢條件鏈結節點信息。信息資源在物理上分散在許多的網路節點上,即“異構平臺、異構數據源”。因此,在分佈的網路環境下開展信息服務, 要打破由此形成的屏障,實現互聯互通。
2.多用戶特征
網路時代的信息資源服務對象是多用戶的。針對不同用戶開展不同服務,就要獲取並管理不同用戶的個性化信息需求,使信息透過大量的需求模板,主動送到用戶的手上。
3.信息豐富特征
網路信息源眾多、數據量巨大、信息豐富。其一方面導致了垃圾信息數據的增多,高效信息檢索方法尤為必要。另一方面,海量信息可能導致一些軟體差錯,需要的處理時間也更長。
4.非專業化特征
網路環境下使用信息檢索系統的用戶大多都不具備專業的信息檢索技能。雖然搜索引擎也支持邏輯組合, 但非專業用戶更加需求靈活的問答式知識檢索、個性化推送等更具智能化色彩的服務。另外,良好的導航能力可以引導用戶在複雜的網路信息中漫游不至於迷失方向,從而更有效的利用網路信息資源。
- 信息內容分析與編碼,產生信息記錄及檢索標識。
- 組織存貯,將全部記錄按文件、資料庫等形式組成有序的信息集合。
- 用戶提問處理和檢索輸出。
關鍵部分是信息提問與信息集合的匹配和選擇,即對給定提問與集合中的記錄進行相似性比較,根據一定的匹配標準選出有關信息。它按對象分為文獻檢索、數據檢索和事實檢索;按設備分為手工檢索、機械檢索和電腦檢索。由一定的設備和信息集合構成的服務設施稱為信息檢索系統,如穿孔卡片系統、聯機檢索系統、光碟檢索系統、多媒體檢索系統等。信息檢索最初應用於圖書館和科技信息機構,後來逐漸擴大到其他領域,並與各種管理信息系統結合在一起。與信息檢索有關的理論、技術和服務構成了一個相對獨立的知識領域,是信息學的一個重要分支,並與電腦應用技術相互交叉。
信息檢索方法包括:普通法、追溯法和分段法。
1.普通法是利用書目、文摘、索引等檢索工具進行文獻資料查找的方法。運用這種方法的關鍵在於熟悉各種檢索工具的性質、特點和查找過程,從不同角度查找。普通法又可分為順檢法和倒檢法。順檢法是從過去到現在按時間順序檢索,費用多、效率低;倒檢法是逆時間順序從近期向遠期檢索,它強調近期資料,重視當前的信息,主動性強,效果較好。
2.追溯法是利用已有文獻所附的參考文獻不斷追蹤查找的方法,在沒有檢索工具或檢索工具不全時,此法可獲得針對性很強的資料,查準率較高,查全率較差。
3.分段法是追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。
- ↑ 蔣瑤. 淺談關於網路信息檢索的認識[J]. 大眾文藝:學術版, 2010(9):2.