信息檢索語言
出自 MBA智库百科(https://wiki.mbalib.com/)
- 信息檢索語言(Information Sarch Language)
目錄 |
信息檢索語言是信息組織與信息檢索時所用的語言,也稱文獻檢索語言、情報語言等。信息資源在存儲過程中,其內容特征(分類、主題)和外部特征(如書名、刊名、題名、著者等)按照一定的語言來加以表達,檢索文獻信息的提問也按照一定的語言來表達,為了使檢索過程快速、準確,檢索用戶與檢索系統需要統一的標識系統,這種在文獻信息的存儲與檢索過程中,共同使用、共同理解的統一標識就是檢索語言。信息檢索語言主要有兩大類:分類檢索語言和主題檢索語言。
信息檢索語言的功能[1]
信息檢索語言是為查找信息服務的,因此,它必須具備以下的功能。
1.信息檢索語言應可表示文獻內容、數據或其他信息形式。為了滿足不同信息用戶的需要,信息檢索語言應能根據不同的信息需求,表達不同的類型。例如,檢索某種器材的性能時,信息檢索語言應能表達某些數據指標;而在檢索某種物質結構時,又能表達物質名稱和物質結構方式。
2.有專用概念表示用戶的信息提問。信息檢索不單純是字面上的組合,而是一種概念上的匹配。例如,電腦繪圖,這裡有兩個名詞,既可拆又可合。拆開後,依據“電腦”可查出“電腦解題”、“電腦控制”、“電腦維修”、“電腦繪圖”等信息;但“繪圖”卻涉及到美術繪圖、工程繪圖、電腦繪圖等,檢索不集中。在信息檢索語言中,概念組配“電腦繪圖”只表示一種概念,這樣專指性強,命中率高。
3.能指示電腦執行查詢與檢索。檢索者用語言項概念表達了信息提問後,要根據檢索系統的功能編寫成檢索策略,使檢索系統能順利、快速地查到信息提問所需要的信息。
信息檢索語言的類型[2]
區分依據 | 類型 | 概念 | |
---|---|---|---|
按結構原理 | 分類語言 | 等級制體 系分類法 | 用分類號表達各種概念並將其按學科性質進行分類和系統排列 |
組配分類法 | |||
按專業範圍 | 綜合性檢索語言 | 在一定範圍內或國際範圍內通用的檢索語言,如各國圖書分類法、國際十進位分類法等 | |
專業性檢索語言 | 適用於某一專業領域的檢索語言,如各國專利分類法、標準分類法等 | ||
按標識的組 合使用方法 | 先組式檢索語言 | 文獻等級制標識在編表時就已固定組配,檢索時不可以改變的語言,如體系分類法、主題法 | |
後組式檢索語言 | 文獻標識在檢索時可以根據需要自由組配的語言,如組配分類法、單元詞或敘詞索引等 | ||
按描述語言 的選詞特征 | 單元詞 | 代表文獻實質意義、可以獨立存在的最小概念單元 | |
敘詞 | 經規範化的可以獨立表達主題概念的詞語 | ||
關鍵詞 | 直接使用的基本上不加規範的自然詞語 | ||
主題詞 | 代表文獻實質意義經規範化的詞語 | ||
代碼 | 表示事物某一方面特征的符號標識,如化合物分子式、環狀化合物標識等 | ||
引證 | 一種表示科學論文之間相互引用關係的語言 | ||
按描述文獻 的特征 | 外表特征標識 | 文獻上顯而易見的特征標識,如作者姓名、文獻篇名、文獻代號、機構名、刊物來源等 | |
內容特征標識 | 表示文獻主題實質意義的特征標識,如分類語言、主題詞、單元詞、敘詞、關鍵詞、自然語言等 |
信息檢索語言的作用[2]
檢索語言可以是一系列概括文獻信息內容的概念及其相互關係的標識系統(分類號碼);也可以是自然語言中選擇出來並加以規範化的一套辭彙(主題詞表或敘詞表)。它的功能主要是:簡單明瞭而又比較專指地描述文獻的主題概念;容易將概念進行系統排列;檢索時便於將標引用語和檢索用語進行相符性比較等。為此,檢索語言必須排除一詞多義、多詞一義和詞義含糊的現象,並且還能顯示出概念間的各種相互關係,這也是檢索語言規範化的主要內容。
信息檢索語言的職能主要包括以下三個方面。
- (1)信息檢索語言可以表示文獻內容、數據或其他信息形式
為了滿足不同信息用戶的需要,信息檢索語言能夠根據不同的信息需求,表達不同的類型。
- (2)有專用概念表示用戶的信息提問
信息檢索不單純是字面上的組合,而是一種概念上的匹配。
- (3)能夠指示電腦執行查詢與檢索檢索者用語言項概念表達了信息提問後,要根據檢索系統的功能編寫成檢索
策略,使檢索系統能順利、快速地查到信息提問所需要的信息。