指南資料庫
出自 MBA智库百科(https://wiki.mbalib.com/)
指南資料庫(Referral Database/Directory Database)
目錄 |
什麼是指南資料庫[1]
指南資料庫是指存儲關於某些機構、人物、出版物、項目、程式和活動等對象的簡要描述,指引用戶從其他有關信息源獲得更相信的一類資料庫,亦稱指示性資料庫。如機構名錄資料庫、人物傳記資料庫、產品資料庫、基金資料庫、軟體資料庫等。
指南資料庫的特點[2]
與其他資料庫相比,指南資料庫有以下特點:
1、存儲的數據位非文獻信息。也就是說,它為用戶提供的是一些客觀實體的指示性描述。
2、檢索方式特別。在大多數資料庫中,主題檢索是一種非常有效的檢索方式。而在指南資料庫中,名稱檢索顯得更為重要。
3、指南資料庫生產者眾多。不但包括各圖書館、信息服務機構,還包括政府機構、公司、行業組織、研究機構、出版機構等等。
4、就數據結構來說,通常指南資料庫的記錄比較長,欄位數量多,還包括一些數值型欄位。
5、排序性能好。指南資料庫中的很多欄位都可以按照數字或者字母的順序進行排序。
6、內容廣泛,類型多,這也是指南資料庫的最大特點。
指南資料庫的類型[3]
指南資料庫的類型很多。按使用範圍可分為內部使用型和公用型或聯機服務型。按信息類型劃分,有以下幾種類型:
(1)人物傳記資料庫:收錄各種人物的傳記信息,大多是傳記詞典的機讀版。
(2)公司名錄資料庫:收錄各種公司的生產與經營活動信息。較重要的有“電子黃頁”、“TRINET機構資料庫”、“DisclosureⅡ”等。
(3)基金指南庫:存儲各種基金信息,
(4)技術標準指南庫:存儲各種技術標準或規程的有關信息。
(5)軟體資料庫:存儲各種電腦軟體目錄信息。
(6)產品指南庫:存儲各種產品或商品信息。
指南資料庫的結構和使用[3]
它兼有文獻資料庫和數值資料庫的特點。通常設有主文檔、倒排檔、索引文檔和數據字典。
主文檔可根據記錄數量多少來決定是否加以劃分。一般來說,對於涉及主題領域較多,內容綜合性較強的指南資料庫,主文檔可採用多子庫或多子文檔的結構。對於單一主題領域和內容較專的,則採用單——主文檔和不定長、多欄位的記錄格式為宜。
為了支持快速檢索,一般都必須建立倒排檔。
指南資料庫檢索的一般過程是:用戶鍵人要查詢的人物、機構或事物名稱,系統根據數據字典或機器詞典,查找索引文檔,然後進入倒排檔中查得有關記錄在主文檔中的位置,最後得到有關的事實。
如前所述,主題檢索在指南庫中顯得較為次要,但按行業分類檢索還是用得較多的。所以,對國外生產的指南庫,我們可能有必要瞭解它們的行業分類表。其中,(標準工業分類表)(Standard lndustrial Classification)用得較多。
其次,在檢索過程中,有些指南庫還可以支持簡單的算術運算,即對記錄中的數值欄位進行運算比較。這種運算不同於文獻資料庫中範圍檢索。它真正把數值欄位作為數值來處理,而不是作為字元串來處理。這種數值欄位可以相加,排序或用於其他操作。
此外,它還可以支持檢索的排序輸出,或按升序輸出(對字母型宇段最有用),或按降序輸出(對數值欄位最有用)。
目前,隨著人工智慧技術的進步,具有推理判斷能力的指南資料庫正在研製之中。這種指南庫中通常含有知識庫、規則庫、推理機、智能介面等結構,並具有學習功能,可以在使用過程中擴充或更新原有的事實。
使用指南資料庫應註意兩點:一是它與傳統檢索工具的關係,二是它的內容完整性問題。有些指南庫是以傳統的指南性工具書為基礎生產出來的;有些則沒有傳統的對應物,是單一的電子出版物。在內容方面,指南資料庫(尤其是聯機指南庫)的更新速度比傳統的工具書快得多,提供的數據內容也可能比傳統的對應物更詳細。另外,由於保密等方面的原因,許多資料庫僅限於內部或有限範圍內使用,即使是可供公眾聯機檢索的有些指南庫,也可能只公開一部分事實。對於某些涉及到敏感領域的事實或數據,一般用戶很難通過聯機指南庫來解決問題。