全文資料庫
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
什麼是全文資料庫[1]
全文資料庫是指存儲原始文獻全文或其中主要部分的一種源資料庫,簡稱全文庫。收錄文獻以期刊論文、會議論文、學位論文、政府出版物、研究報告、法律條文和案例、商業信息、圖書為主。如EBSCO全文資料庫、中國人大報資料中心複印報刊資料全文資料庫、維普的中文科技期刊資料庫、萬方的中國學位論文全文資料庫、超星數字圖書館等。
全文資料庫的種類[2]
按出版方式劃分,全文資料庫可分為兩類:一類是與印刷型文獻平行出版的全文庫,另一類是純電子出版物,無相應的印刷型文本。
按存貯內容劃分,全文資料庫有直接原文型和文摘型。前者直接存貯文獻的正文,有時甚至還包括正文以外的其它信息,如腳註、參考文獻目錄、文摘等。文摘型就是原文經過壓縮提煉,改寫成若幹篇一定長度的摘要。現在的全文資料庫多為直接原文型。
按應用領域劃分,目前主要有以下類型:
1、法律法規全文庫或條例庫
法律信息多年來一直是全文檢索的領先者。眾所周知,法律條文中的每句話甚至每個字都是很重要的。有的甚至可以說是一言九鼎,而實際生活中各種法律多如牛毛,手工查找非常困難,書目資料庫又不能直接提供原文。所以,法律界對全文資料庫的需求最為迫切。美國Mead數據中心的LEXIX系統和西部出版公司的WESTLAW系統,是美國的兩個主要的商業性法律全文資料庫檢索系統。國內比較有影響的是《法律之星》和《中國法律法規資料庫》。
2、新聞資料資料庫
在商業性的信息檢索系統中,也廣泛提供報紙、新聞公報之類的材料。
3、雜誌和參考書資料庫
從1983年起,DIALOG信息檢索服務公司和書目檢索服務公司(BRS)開始將專業雜誌和參考書增加到它們的服務中來。如BRS系統中的美國化學學會原始期刊資料庫、DIALOG系統中的通俗期刊全文庫。我國也出現廠這種檢索方式,如清華大學出版的《中悶學術期刊(光碟版)》全文資料庫。
4、商情全文庫
如英國Datasolve公司的市場新聞和研究報告全文庫,美國《哈佛商業評論》全文庫。
5、醫學文獻全文庫
如國際研究交流系統(1RCS)的醫學雜誌摘錄庫,BRS系統的急救醫學文庫(Critical Care Medical library)。
全文資料庫的特點[3]
與其它資料庫相比,全文資料庫有許多特點,主要表現在:
(1)包含信息的原始性。庫中信息基本上是未加工的原始文獻,因而具有客觀性。
(2)信息檢索的徹底性。任何詞、句、字皆可檢索,還有可能看到某些邊緣性信息。
(3)檢索語言的自然性。可使用自然語言檢索,並可使用布爾檢索和位置檢索,因而要涉及自然語言的理解。
(4)數據結構基本上是非結構化的,除了某些可規範的數據外,大量文本屬於非結構化的,不便於關係資料庫的處理。
(5)專業的全文資料庫系統一般都採用“自動切詞”技術。
(6)好的全文資料庫還備有知識庫,可具有推理能力和聯想式檢索。
(7)基本上是封閉性的,數據不需更新,具有較大的穩定性。
(8)全文資料庫占用的存儲空間非常龐大,系統開銷大,如何提高檢索速度是一大難題。