全球专业中文经管百科,由121,994位网友共同编写而成,共计436,011个条目

文獻檢索系統

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

目錄

什麼是文獻檢索系統

  文獻檢索系統又叫文獻情報檢索系統,它是檢索和提供文獻線索、文獻地址、文獻目錄、文獻原文或文獻複製件的一種常見的檢索系統。它是一個使情報用戶需要同文獻情報源之間相互聯繫,包含有文獻情報資源,具備一定的物質載體與設備,能夠提供一定檢索技術手段的有機整體。

  在文獻檢索系統中,文獻描述體資料庫,就是文獻檢索工具。檢索工具雖然是文獻著錄款目的集合,但它卻包含了詞表、索引等因素。它是一種有形的實體,總是同一定的載體設備相聯繫,它必然具備一定的檢索手段和潛力,並且總是體現著一定的用途、對象和目標。實際上,檢索工具就是檢索系統的核心和概括。文獻檢索系統的種類主要有:

  • 書目檢索系統。書目檢索系統包括傳統的文摘、索引和目錄、機讀目錄、聯機目錄以及提供書目資料庫查詢服務的系統。
  • 全文檢索系統。全文檢索系統包括傳統的縮微檢索系統、電子報刊、電子辭書以及能提供其它全文資料庫查詢服務的系統
  • 語段檢索系統。以語段作為存貯和檢索單元,介於文獻檢索與事實檢索之間。

文獻檢索系統的構成

邏輯構成

  一個完整的文獻檢索系統通常包括以下六個方面,即六個子系統:

  (1)文獻選擇子系統,即檢索工具對一定學科範圍文獻的覆蓋面,摘貯率,以及對文獻類型、文種與時間跨度的包含程度。

  (2)詞表子系統,即作為文獻的存貯與檢索兩個方面的用來表達文獻內容與提問內容的共同依據,詞表(包括主題詞表和分類表等)的規模(網羅度)與細分程度(專指度),是影響檢索工具查全與查準潛力的重要因素。

  (3)標引子系統,即根據一定的詞表,將文獻的主題內容經過概念分析,而翻譯(轉換)成檢索系統語言的辭彙。這裡,不僅決定文獻描述的準確性和信息含量,而且引得深度、標引的一致性也是影響檢索效率的因素。

  (4)查尋子系統,即把情報用戶的需求,經過概念分析,翻譯(轉換)成檢索系統語言的辭彙,並指出其邏輯關係的過程,具體來說,就是構造檢索策略的過程。

  (5)用戶與系統之間交互子系統,即通過同情報用戶的商談並收集反饋,弄清用戶的真實情報需求,形成明確的檢索概念,並將其準確地表述出來的過程。這是確定具體檢索目標的過程,即決定檢索的角度、深度、廣度和時間、文種範圍的關鍵一步,也是成功地制定檢索策略、實施檢索的前提。

  (6)匹配子系統,即檢索策略同文獻索引中的有關標引記錄相比較而決定其取捨的過程。情報檢索的實質,就是文獻特征同情報提問之間的“匹配”。

  匹配的各種技術與方法,決定了各種不同的檢索方式———如純手工的檢索方式、半機械的檢索方式、光電檢索方式、電子電腦檢索方式等。在電腦情報檢索的條件下,機器的功能與程式的質量是衡量匹配效率的根據。由於文獻信息量大,屬性複雜多樣、連貫性強,故文獻檢索系統中信息存貯通常採用非定長的文件方式。每篇文獻用單一的獨立記錄來描述和表示,並需要建立多種索引結構,以支持系統對提問作出迅速的響應。

物理構成

  任何文獻檢索系統的物理構成都可以分解為以下三個部分:

  (1)硬體。算機及其外部設備,通訊設施;或是卡片穿孔機,分類機;縮微照相機和閱讀機;或是其它用於文獻加工、存貯和報道的設備。

  (2)軟體。電腦系統的軟體和應用軟體,檢索軟體;標引方法,標引專家;檢索技術,檢索專家。

  (3)文獻庫。機讀文獻磁帶、磁碟,聯機文獻庫,光碟資料庫;或是載有文獻信息的縮微品,穿孔卡片集合,卡片式目錄,書本式檢索工具。

文獻檢索系統檢索效率及檢索結果評價

  綜合指標檢索效率是指在特定的檢索系統、資料庫中按一定的檢索策略進行檢索所獲得的檢索結果的綜合指標。人們在進行科技情報檢索時,往往不能如願,這是因為大多數檢索工具或檢索系統,目前只處理文獻標誌,但文獻標誌只表示文獻的中心主題,而不是表示文獻的次要主題。因此檢索工具或檢索系統只能回答情報提問而不一定能滿足用戶的情報需求。另外,一般的檢索者只能大概地表述自己的情報提問,而不能確切地衡量文獻與提問的切題程度。並且檢索課題性質、範圍、深度往往不斷變換;查找文獻的方法尚未形成固定模式;詞表質量仍存在問題;人們的知識面存在一定局限等。正因為存在上述原因,文獻標引與檢索失誤就不可避免。

  檢索效率的測評有助於發現檢索系統的缺陷及其原因,提高資源分配的合理性,改進系統的性能和服務質量,優化新系統的設計,豐富情報檢索的理論和技術。

檢索結果評價的綜合指標

  檢索效率是對檢索結果的評價,評價的標準不盡統一,具體來說,包括檢索掃描範圍的完整性、查全率查準率、新穎率、檢索響應時間、用戶負擔、檢索結果輸出方式的靈活性等。

  (1)檢索掃描範圍的完整性。指資料庫(或書本式檢索工具書)所錄文獻數據的完備程度、摘貯率、每條記錄(書目引文等)的信息含量。

  (2)查全率。指資料庫中事實上存在的相關記錄、其中被檢出的百分比。它是衡量系統檢出相關文獻的能力。用公式表示為:

  查全率=(被檢出的相關文獻量÷檢索系統中所有相關文獻量)×100%

  查全率的反面是漏檢率。在檢索過程中,未檢出的文獻當中可能存在少量相關文獻,此部分文獻叫漏檢文獻,它與檢索系統中所有相關文獻量的百分比即為漏檢率,其公式為:

  漏檢率=(未檢出的相關文獻量÷檢索系統中所有相關文獻量)×100%漏檢率可作為衡量檢索效率的參數。

  (3)查準率。指被檢出的文獻(記錄)中,其中被鑒別為是查準了的百分比。它是衡量系統拒絕不相關文獻的能力。其公式為:

  查準率=(被檢出的相關文獻量÷被檢出的文獻量)×100%查準率的反面是誤檢率。在檢索時,在檢出的文獻當中可能會夾雜著不相關的文獻,那麼此部分文獻叫誤檢文獻,它與被檢出的文獻量的百分比即為誤檢率。其公式為:

  誤檢率=(被檢出的不相關文獻量÷被檢出的文獻量)×100%誤檢率也可作為衡量檢索效率的參數。

  (4)新穎率。指被檢出的文獻(記錄)中,用戶在檢索前未掌握的資料的百分比。這在一定程度上反映了資料庫(檢索工具書)的時差及更新周期的長短。它是衡量檢索系統提供信息及時性的一種測度。

  (5)檢索響應時間。指用戶輸入檢索式至獲得檢索結果的時間之長短。它在一定程度上反映了檢索系統的檢索匹配速度及其所採用的檢索演算法。

  (6)用戶負擔。指用戶取得一定檢索結果的經濟負擔,以及構造檢索策略時的智力負擔。前者反映了檢索系統運行的成本與收費水平,後者反映了檢索系統的易用性及對用戶幫助的水平。

  (7)檢索結果輸出方式的靈活性。指檢索系統能否提供顯示、列印、套錄、按指定欄位輸出以及檢索結果排序的多種選擇。

檢索效率評價方法

  確定評價對象與目的;選擇評價方式;設計評價方案;實施評價;評價結果的分析與解釋;改進系統的性能與效益。

  (一)提高檢索效率的途徑

  提高檢索效率是國內外研究與使用各種檢索方法與檢索裝置的主要目的,即在客觀條件允許的範圍內儘可能查得全;查得準,以求達到最佳的檢索結果。要提高檢索效率應從以下兩方面著手。

  (二)提高檢索工具的質量

  檢索工具的質量是影響檢索效率的客觀因素。一般來說,檢索工具搜羅文獻的數量越多、引得的深度越大,即文獻的檢索標識數目越多,查全率越高。如果一篇文獻在檢索工具中只有一個標目,那麼它在檢索工具中就只有一個位置。如果通過分析、互著、參見等方法,使它得到多次反映,那麼從各個角度檢索到的可能性就增大。由此可見,引得深度的提高,意味著文獻被檢索到的比率的提高。它是檢索工具編製工作的重要質量指標。另一方面,檢索語言的專指度越高,即表達概念的外延越小,查準率越高。因此,要提高檢索效率,就必須提高檢索工具質量,而要提高檢索工具質量,就必須在文獻的數量、引得的深度、檢索語言的專指度上下功夫。

  (三)提高檢索人員的素質水平

  檢索人員的素質水平是影響檢索效率的主觀因素。檢索者在檢索過程中的每一步驟和所作的安排和部署,包括選擇檢索的工具、方法、途徑等,均取決於檢索者的專業知識、文獻知識和檢索技能。如果檢索人員的素質水平高,就會通過最便捷的途徑獲取自己所需文獻,達到事半功倍的效果。如果檢索人員素質水平低,在檢索過程中誤入歧途的可能性就大,從而導致檢索效率低的結果。因此,提高檢索人員的素質水平,是提高檢索效率的關鍵。

參考文獻

  • 李輝.文獻檢索系統及檢索效率評價指標分析[D].科技創業.2012
本條目對我有幫助0
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目投訴舉報

本条目由以下用户参与贡献

刘维燎.

評論(共0條)

提示:評論內容為網友針對條目"文獻檢索系統"展開的討論,與本站觀點立場無關。

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

下载APP

闽公网安备 35020302032707号