知識聚類
出自 MBA智库百科(https://wiki.mbalib.com/)
目錄 |
知識聚類也稱為知識分類組織法,是指將知識按一定的聚類標準分門別類地加以類集和序化的過程。聚類和分類是一個過程的兩個方面,分類的結果產生了聚類,聚類的結果產生了分類。
知識聚類的方法[1]
知識聚類的方法,根據其聚類標準的不同,可分為多種類型。
1.以學科聚類
知識的學科聚類方法,是最基本的也是人們最常用的知識聚類方法,它是指以知識的學科屬性為聚類標準,把不同學科的知識分別加以集中與整序,從而形成知識的學科序列系統的一種方法。知識的學科聚類,是古合中外各種文獻分類法的方法論基礎。目前世界上最廣泛應用的《杜威十進分分類》(DDC),就把人類全部知識概括為10大學科(其中“總論”為特例,其它分類法中也均有類似特例),其學科名稱與標記符號如下所示:
000 總論
100 哲學
200 宗教
300 社會科學
400 語言
500 自然科學與數學
600 技術(應用科學)
700 藝術、美術和裝飾藝術
800 文學
900 地理、歷史及輔助學科
自DDC創製以來,世界各國的文獻分類法大都採用了與DDC相似的體例,如《美國國會圖書館分類法》(LCC),把知識歸納為20大學科;(國際十進分類法》(UDC),把知識歸納為10大學科;《書目分類法》(BC),把知識歸納為26大學科;《前)蘇聯圖書館一書目分類法》,把知識歸納為21大學科;《中國圖書館分類法》,把知識歸納為2大學科,等等。這些文獻分類法在知識聚類的結構方法上均採用了同一種方法,即用類目—具有某種共同屬性的文獻知識的集合性概念—表示各學科、子學科及其類屬因數,用類目的等級體系以及參照、註釋等方法來顯示知識關聯(類目之間的關係)。文獻分類法的這種結構特點,使各學科知識形成族性序列,便於族性檢索。文獻分類法對知識體系的表示,雖然表現為學科分類體系,但它同時又產生了學科聚類的結果。所以,在文獻分類法中,學科聚類與學科分類是互為前提、互為結果的。這就是我們把知識的分類組織方法等價為知識的聚類組織方法的根據所在。
2.以概念聚類
知識是由概念構成的。任何一種知識都具有特定的概念結構。以概念聚類知識,就是指用一定的概念邏輯方法來集中排列相關知識的一種方法。
任何一個概念都有內涵和外延兩方面,而且兩者之間具有反變關係,即內涵越多,外延越小;內涵越少,外延越大。根據這種反變關係,我們可以通過增加概念內涵的方法來縮小概念的外延,從而形成更為專指的概念;也可以通過減少概念的內涵的方法來擴大概念的外延,從而形成更為泛指的概念。
利用概念的內涵與外延之間的這種反變關係,可以形成兩種概念邏輯方法:一是概念的概括與劃分方法,二是概念的綜合與分析方法。知識的概念聚類,就分別採用了這兩種概念邏輯方法。
2.1以概念的概括與劃分方法來聚類知識
所謂概念的概括,是指把若幹個外延較窄的種概念,按照一定的標準,概括為一個外延較寬的屬概念的邏輯方法;所謂概念的劃分,是指把一個外延較大的屬概念,按照一定的標準,劃分為若幹個外延較小的種概念的邏輯方法。對概念進行層層劃分,就形成概念的等級體系,而把這一過程進行反向推演,便是概念的概括。因此,在同一序列概念體系中,概念的概括與劃分呈現為同一過程的反向推演。這種反向推演的過程,也就是“分類”與“聚類”的統一過程,其結果形成了知識的層次聚類結構。這也就是等級列舉式分類法所採用的知識聚類方法。
2.2以概念的綜合與分析方法來聚類知識
所謂概念的綜合,是指把若幹個簡單概念戴概念因素綜合為一個複雜概念的一種邏輯方法;所謂概念的分析,是指把一個複雜概念分析為若幹個簡單概念哦概念因素的一種邏輯方法。概念的分析,可以形成概念的多向成類;概念的綜合,可以形成概念的多向組合。概念的多向成類與多向組合結構,可以形成知識的交叉網路聚類結構。知識的交叉網路聚類結構比之知識的層次聚類結構,更容易反映和容納新概念、新知識,更容易進行概念戴知識的自由組合。文獻分類法中的分面組配式分類法,就是以概念的綜合與分析方法來聚類知識的。如在阮岡納贊的《冒號分類法》中,把每一事物按其不同屬性表現分析成多個面(facet),每個面進一步分析為“游離焦點”(ioslatedfocus)和“基本焦點’(basicfocus),游離焦點和基本焦點可以綜合成複合類(compoundclass〕,其綜合類型分為傾向相、工具相、觀點相、比較相、影響相和相關相6種,最後把各個面按本體、物質、動力、空間和時間這5個基本範疇的先後順序加以區分,由此構成了知識聚類的交叉網路結構。
在以概念聚類知識的過程中,如果把所有的概念分學科層累制標記符號加以編排,就形成了分類法系統;而如果把所有的概念按其字順加以編排,就形成了主題法系統。
3.以事聚類
所謂以事聚類,是指圍繞某些事物戴事件來集中編排相關知識的一種知識聚類方法。從一般概念邏輯上看,“事物”包含“事件”,但在知識組織活動中,人們往住把關於歷史事件的知識從一般事物知識中抽出來單獨加以組織,由此形成了以事件聚類知識和以事物聚類知識的兩種以事聚類形式。
3.1以事件聚類知識是指圍繞某一歷史時期的某一事件戴某些事件來集中編排相關知識的一種方法。以事件聚類知識可分為單一事件知識的聚類和多事件知識的聚類兩種形式。單一事件知識的聚類,能夠集中詳實地記述某一事件的相關知識。如《九一八事件》、《西安事變》、《南京大屠殺》等文獻,就詳細記述了這幾起歷史事件的前因後果。一些記錄性或歷史題材的影視作品,也能形象生動地記述一些重大歷史事件的相關知識,如影片《南昌起義》,就集中而生動地記述了有關南昌起義的歷史背景、人物、經過、結局等史實性知識。多事件知識的聚類,能夠簡略概述一定歷史時期所發生的一些重大事件的相關知識,如《中華人民共和國大事記》(1949一1980年),就記載了共和國40年發展歷程中所發生的5000多件大事;《中國經濟年鑒》(1995年)除了大量的經濟統計資料之外,還記載有1994年一年間我國經濟生活中所發生的450多件大事,等等。
3.2以事物聚類知識是指圍繞某一事物戴某些事物來集中編排相關知識的一種方法。許多工具書一般都具有以事物聚類知識的功能,其中類書最為典型。類書是輯錄古籍片斷、整篇戴整部著作,按類目戴韻部編排,以供尋檢、徵引相關知識的工具書。
通過類書,我們可以查考事物的起源、查找典故出處、查檢詩詞文句、檢索參考資料等。由於類書廣泛輯錄各類知識資料,所以被認為是以事物聚類知識的典型代表。中國古代盛行編纂類書之風,如《北堂書鈔》、《藝交類聚》、《太平御覽》、《冊府元龜》、《永樂大典》、《古今圖書集成》等。其中,在編纂體例上最具特色的是唐歐陽河等編的《藝文類聚》。其編排體例上的特點就是首創了“事文合編’的體例。所謂“事’,就是指那些對某一事物的解釋性、介紹性的知識資料;所謂“文”,是指那些與具體事物有關的詩文歌賦。《藝文類聚》全書共10捲.百餘萬言,分天、歲時、地、山、水、草、木、鳥、獸等46部(即事物類別),部下有子目727個,每一個類目不僅“輯事”,而且還`輯文’,“事居於前,文居於後’。堪稱以事聚類知識的典範。
4.以用聚類
所謂以用聚類,是指按知識本身的用途戴效用來集中編排相關知識的一種方法。在文獻知識組織中,以用聚類要體現用戶保障原則和文獻保障原則。從這個意義上看,以用聚類知識.實際上就是按用戶的實際需求來集中相關知識的一種方法。
文獻情報部門在文獻採集工作中,始終遵循以用聚類的原則。如高校圖書館的文獻採集,就要考慮與學校所設專業對口的原則,同時還要考慮與用戶學歷層次相對應的原則;科技圖書館的文獻採集,就要考慮與用戶科研課題需要相對口的原則;公共圖書館的文獻採集,就要考慮用戶需求多樣性(類型多、層次不一)的特點,同時還要考慮一些重點讀者的個別需求,等等。由此形成了各文獻情報部門的以用聚類的文獻收藏特點。
在文獻知識的分類組織中,有一個“實際效用原則”,即文獻歸類時要考慮本單位的專業性質和本單位專業讀者的需要,要把文獻歸入到最大用途的類目中去。這一原則充分體現了以用聚類知識的原則精神。為了充分體現和落實“實際效用原則”,一要樹立專業意識,二要樹立用戶意識。所謂樹立專業意識,就是要把文獻知識儘可能地歸入到與本單位專業最密切的類目中去,以便於這部分文獻知識的集中檢索與利用。例如《安全生產與心理學》一書,理應歸入《中圖法》“x91l安全心理學”,但對於心理學研究所來說,應考慮歸入《中圖法》“B849應用心理學’,並可用組配法組配為B849:x911。所謂樹立用戶意識,就是要把文獻歸入到本單位讀者最熟悉、最需要的類目中去,例如,《簡明數理邏輯》一書,理應歸入《中圖法》“0141數理邏輯”,但對公共圖書館來說,廣大讀者最為熟悉的類目是《中圖法》`B813數理邏輯”,因此,應考慮把此書歸入“B813數理邏輯”(即把“B〔813〕數理邏輯”這一交替類目,改為使用類目)。
另外,在中國古代的四部分類法理論中,把所有圖書文獻按經、史、子、集四大部類及其順序來組織編排,也體現了以用聚類知識的思想,只不過這裡的“用.體現了封建統治階級的政治立場,意旨在使圖書文獻按“經→史→子→集”的重要性遞減順序發揮其效用。
5.以人聚類
所謂以人聚類知識,是指圍繞某一人物或某些人物來集中編排相關知識的一種知識聚類方法。它可分為以人物的生平事跡聚類和以人物的思想類別聚類兩種類型。
5.1以生平事跡聚類是指以記述人物的生平事跡為主線來組織相關知識的一種方法。這種方法主要體現在傳記類文獻和非傳記類文獻中的人物部分。人物傳記可分為個人專傳和多人群傳兩種類型。個人專傳能夠集中詳實地記述某一人物的生平事跡。多人群傳則一般概略介紹被傳人物的生平事跡,如《中國人名大辭典》、《中國文學家大辭典》、《世界著名科學家簡介》等。非傳記類文獻中的人物部分,也能提供有關人物的相關情況,如《中國大百科全書》各捲的人物部分,就概略性地介紹了各學科主要代表人物的生平及其科學成就。
在中國古代的文獻編纂活動中,以人物的生平事跡為主線來組織相關知識的方法,得到了比較廣泛的應用,其中最具代表的是《冊府元龜》和紀傳體史書。《朋府元龜》(又名《歷代君臣事跡》),由宋代王欽若等編輯,是宋代四大類書之一,但因其專門記述歷代君臣事跡,故可將其視為“準傳記”文獻。紀傳體史書,是以人物傳記為中心來敘述史實的一種史書體裁,始創於我國漢代司馬遷所著《史記》。我們通常所說的“二十四史”,便是記傳體史書。《史記》中的人物傳記分為本紀、世家、列傳3種類型。本紀是按年月次序編寫的帝王簡史,以記載帝王言行政績為主要內容;世家是用來記載子孫世裘拍l王侯封國的歷史,實際是諸侯的“本紀’;列傳主要是記述將相大臣和王公貴族及各階層代表人物的生平事跡。可見,《史記》等紀傳體史書,在其編輯體例上也體現了以人物的生平事跡為中心來集中相關知識的方法。
5.2以思想類別聚類是指按人物所屬的不同思想類別(戴稱派別)來集中相關知識的一種方法。人物思想類別的最顯著表王她就是各種科學學派戴流派。所謂科學學派,是指擁有獨樹一幟的研究綱領,由領袖人物及其追隨者組成的享有較高集體威望的科學共同體。在科學發展史上,出現了許許多多有形或無形的科學學派,如物理學上的劍橋學派、哥本哈根學派、費米學派等,數學上的柏林學派、布爾巴基學派等,化學上的信息學派、結構學派等。按學派類別集中知識,不僅能反映一個學派整體的科學主張、觀點、方法及其成就,而且還能反映學派共同體中每個成員的科學思想及其成就。任何一個學派都是由其領袖及其追隨者組成的,所以按學派類別集中知識,實際上也屬於以人聚類知識的一種方式。
在文獻的分類組織方法中,國內外的各種分類法都把“以人列類’作為重要的分類標準之一,其實質就是以人物的生平事跡戴思想類別來集中知識的一種方式。例如在《中圖法》(第4版)中,“B21/26中國各代哲學”、“B502/506歐洲各時代哲學”、B51/56歐洲各國哲學”、“B712美國哲學”、“F09經濟思想史”、“I211魯迅作品及其研究、“K81傳記”等,均採用了“以人列類”的方法。
6.以時空聚類
任何知識都具有時空屬性戴結構。根據知識的時間特性和空間特性來對相關知識加以集中編排戴整合的過程,就是以時空屬性聚類知識的方法。它可分為以時間屬性聚類、以空間屬性聚類和以時空綜合屬性聚類3種類型。
6.1以時間屬性聚類就是根據知識產生的時間序列來集中編排戴整合相關知識的方法。例如,在文獻分類組織中,以時代列類和依時代復分(如《中圖法》中的“依國際時代表分’和“依中國時代表分’),就屬於以時間屬性聚類知識的方法。
6.2以空間屬性聚類就是根據知識產生的地理區域,把相關知識按域別加以集中編排戴整合的方法。在文獻分類組織中.以國家戴地區列類和依國家戴地區復分(如《中圖法》中的“依中國地區表分’和“依世界地區表分”)就屬於以空間屬性聚類知識的方法。另外,以民族列類和依民族復分,也可視為以空間屬性聚類知識的範疇,因為世界上的各個民族都有自己的歷史聚集地(這個聚集地隸屬於某個國家戴地區),而且各民族文化也是以其歷史聚集地為中心形成和發展的。
6.3以時空綜合聚類就是把時間屬性和空間屬性綜合在一起作為聚類標準的一種方法。在《中圖法》中,“依世界地區表分,中國再依中國時代表分’、“依中國地區表分,再依中國時代表分”,這種復分方法就屬於以時空綜合聚類的方法。知識的時間屬性和空間屬性的綜合,往往表現為一種立體網路結構,這種立體網路結構如果體現在知識的實際運用過程中,就會產生知識的整合效應,而這種整合效應正是知識創新的一種表現。
知識的時空整合,主要表現為以下幾種倩形:
.將時空距離相近的知識加以整合。這種整合,不僅可以實現知識的歸類,反映某一學科的發展現狀,還可以進行某一學科研究成果的對比研究。
.將時間上相近、空間跨度較大的知識加以整合。這種整合可以實現不同知識成果的交叉、滲透,有利於新知識的產生。知識空間的跨度越大,知識單元之間的差異就越大,各知識單元之間的優勢互補應越明顯,其整合效果也就越大。
.將時間跨度較大、空間上相近的知識加以整合。通過這種整合,可以看出某一學科、某一領域的發展脈絡,預測其發展趨勢,也可以找出某一事物發展的主導因素和其中的關鍵性問題。
.將時間跨度和空間跨度都較大的知識加以整合。通過這種整合,可以極大地發揮各知識單元之間的“雜交.優勢,使一些老的學科煥發青春,並產生出新的學科。許多新興的交叉學科、綜合學科的誕生,就是通過這一途徑實現的。
知識聚類的方法類型多種多樣,絕不僅限於上述6種。隨著科學技術的發展和人類知識組織活動的繼續深化,有可能產生出更多更新的知識聚類方法,而且現行的知識聚類方法,也必將得到進一步的完善。
知識聚類的意義[1]
1.知識聚類的分類學意義
同知識的分類組織一樣,知識的聚類組織的基本職能是知識的整序。知識聚類的基本原理是“物以類聚”。所謂“物以類聚”,就是事物的分門別類相聚,亦即分類相聚。通過物以類聚”,使知識得以類集,形成知識的有序集合系統。文獻情報部門對文獻的採集、存貯和加工整序過程,實際上就是知識的聚類組織與分類組織過程。文獻流一旦匯流到文獻情報部門,就慧味著形成了知識的有序化存檢系統。
2.知識聚類的物理學意義
同任何物質運動都需要有一定的勢能與動能一樣,知識的運動也需要有一定的勢能與動能。知識聚類的過程,可以把它看作是知識勢能的形成與增大過程。知識聚類量的增大,如同是水庫水位增高而水能增大一樣,增大了知識運動的總體能量。這對加大知識的傳播利用率是極為有利的。從這個意義上說,知識聚類的過程,也就是知識能量的聚積過程。例如《四庫全書總目》、《永樂大典》、《中國大百科全書》、《不列顛百科全書》等,它們的學術價值和資料價值之所以如此之大,正是因為它們通過知識聚類手段蘊藏了巨大的知識能量;同理,美國國會圖書館、不列顛圖書館、北京國家圖書館等,它們之所以享有“知識殿堂”的美譽,也是因為它們通過知識聚類手段潛藏了巨大的知識能量。
3.知識聚類的創造學意義
知識聚類能夠把知識戴知識因素加以聚集與整合,為知識域知識因素之間的相互比較、相互借鑒、相互交叉、相互滲透提供了有利條件,這對知識的研究與創新是極為有利的。許多交叉學科、橫斷學科以及其他知識創新成果,往往就是知識的聚類分析與整合的產物。由此可見,知識聚類絕不僅僅是對知識的積累、整序等簡單性勞動,其中還包含有高智力活動的創造性勞動。
知識聚類與知識分類的關係[1]
1.知識聚類和知識分類之間也有緊密的聯繫:
它們都是對事物進行屬性區分的過程,而且往往表現為同一過程的兩個方面,即知識分類的結果同時可以產生知識聚類的結果,知識聚類的結果同時可以產生知識分類的結果。正是因為知識聚類和知識分類之間存在著反向分合關係,所以很容易使人們只註意兩者之間是同一過程的聯繫一面,而忽視兩者之間的區別一面。
2.知識聚類和知識分類之間的主要區別在於:
首先,知識聚類是知識因素的合集過程,而知識分類則是知識因素的分集過程,若借用化學術語表示,知識聚類就是知識因素的`聚合反應’過程,而知識分類則是知識因素的“裂變反應’過程。這一區別可分別用圖1、圖2表示:
其次,知識分類往往只是把不同知識加以區分,便完成其過程,一般不產生新知識,而知識聚類則不僅能夠區分不同的知識,而且還可以進行不同屬性知識之間的整合,其結果可以產生新知識。再次,在人們日常語言習慣中,知識分類往往是指從學科屬性區分知識的門類,而知識聚類則不單指按學科屬性聚類,它還有許多其他聚類標準。