資源描述框架
出自 MBA智库百科(https://wiki.mbalib.com/)
- 資源描述框架(Resource Description Framework,簡稱RDF)
目錄 |
資源描述框架是由全球信息網協會(W3C)主導和結合多個元數據團體所發展而成的一個架構,是能夠對結構化的元數據進行編碼、交換和再利用的基礎架構。
資源描述框架的特點[1]
RDF是一個能對元數據進行編碼、交換和再利用的基礎結構,RDF的數據模型為資源描述提供了一個簡單而好用的模型,它具有如下特點。
- 1.可控制性
RDF使用“資源——屬性——屬性值”模型進行資源描述,資源描述方式得到了簡化。因此,當資源數量很大時,也很容易控制。這一點對描述網上資源特別重要,目前網上資源越來越多,如果描述資源的元數據格式太複雜,就會降低元數據的使用效率。採用RDF模型進行資源描述,可以提高資源檢索和管理的效率,更有效地發揮元數據的作用。
- 2.可擴展性
RDF模型的辭彙集和資源描述是分開的。RDF可以使用多種辭彙集來描述資源,也允許任何人定義自己的辭彙集,它不僅可以攜帶普通文檔的元數據,如DC元數據,也可以攜帶其他類型的元數據,如MARC元數據。如果要增加描述資源的屬性,只需要在辭彙集中增加相應元數據即可。所以,RDF具有良好的擴展性。如果使用關係資料庫,在數據表中增加新欄位,就不會這麼容易了。
- 3.可交換性
RDF使用XML格式作為通用語法,這使各種元數據體系之間的轉換成為現實。另外,當使用多種元數據描述資源時,可以運用RDF Schema定義不同辭彙集的元數據之間的關係。這樣,就可以在不同辭彙集之間通過指定元數據關係來實現元數據的交換。
- 4.可綜合性
在RDF中,資源的屬性是資源,屬性值可以是資源,關於資源的陳述也可以是資源。它們都可以用RDF來描述,這樣就可以很容易地將多個描述綜合起來,產生錶面不易觀察出來的信息,這將對知識發現技術產生深刻的影響。RDF不僅可以描述單個資源,也可以將同類的資源集中起來,如某個軟體的多個不同下載地址等。
- 5.可理解性
RDF採用了屬性和子屬性等面向對象的概念,使得資源之間的層次十分清晰,也使得屬性的繼承關係得到很好的體現。它的關聯機制提供了描述和內容之間的關聯描述,對於對象之間的關係描述十分有效。因此,使用RDF模型描述資源,特別便於電腦處理和人的閱讀理解。
資源描述框架的設計目的[2]
RDF的設計目的是能以最低限度的約束,靈活地描述信息。具體目標包括:
(1)有一個簡單的數據模型:RDF有一種便於應用程式處理和操作的簡單數據模型,這個數據模型獨立於任何特定的序列化語法。
(2)有形式化語義和推論:RDF有一個形式化的語義,它為對關於RDF表達式的含義的推理提供了一個可靠的基礎。特別地,它提供了一個嚴格定義的蘊涵概念,從而為在RDF數據中定義可靠的推理規則奠定了基礎。
(3)使用基於URI的可擴展辭彙集:基於具有可選的片段標識符(URI引用,或URIrefs的URIs),辭彙集是完全可擴展的。URI引用在RDF中被用來命名所有類別的事物。
(4)使用基於XML的語法:RDF有一份XML序列化格式的推薦標準[RDF SYNTAX],它是可以用來編碼的應用程式之間交換信息的數據模型。
(5)使用XML Schema數據類型:RDF可以使用根據XML Schema數據類型[XML SCHEMA2]所表示的數值,從而有助於在RDF和其他XML應用程式中交換信息。
(6)允許任何人發表關於任何資源的陳述:為了推動在互聯網層次上的操作,RDF應該是一種開放的框架,允許任何人發表關於任何資源的陳述。
資源描述框架的的構成[2]
RDF由RDF Data Model、RDF Schema和RDF Syntax三個部分組成。
- (1)RDF Data Model
資源描述框架(RDF)定義了一種通用的數據模型,即RDF Data Model(RDF數據模型),通過資源、屬性和值來描述特定信息資源。其中,資源(Resource)是指所有在Web上被命名的、具有統一資源描述符(URI)的對象。資源可以是一個完整的網頁集合,也可以是網頁中的一部分,或者是XML文檔中的元素等。屬性(Property)是用來描述資源的特定特征或關係,每一個屬性都有特定含義。與資源相關的屬性被定義為屬性類型(Property-type),用來定義它的屬性值和所描述資源形態,以及和其他屬性的關係。值(Value)可以是由文本字元串、數字等表示的字面值,也可以是其他資源。
特定的資源以一個被命名的屬性與相應的值來描述,則稱為“RDF陳述(Statement)”,可理解為“資源R具有值為V的屬性P”。在RDF中,每個陳述的基本結構都是一個以主語、謂語、賓語這樣的次序的三元組。其中,主語(Subject)是資源,謂語(Predicate)是屬性,賓語(Object)是值。資源描述框架的基本數據模型如圖所示:
- (2)RDF Schema
RDF Schema是RDF的語義擴展,它使用一種機器可理解的體系來定義描述資源的辭彙,提供了描述相關資源以及這些資源之間關係的機制。其基本作用包括:定義資源的屬性類、語法、屬性值的類型;定義資源類以及屬性所應用到的資源類;聲明由一些機構定義的元數據標準的屬性類。
RDF Schema提供了核心類(Core Class)、核心屬性(Core Attribute)和核心限制(Core Constraint)等機制來定義資源的類、屬性、資源和資源之間的繼承關係等。資源的類(Class)類似於面向對象中“類”的概念,指的是事物的一類。某一類中的一個具體事物稱為“實例(Instance)”。在RDF Schema中的核心屬性有“rdfs:type”、“rdfs:subCIassof”、“rdfs:sccAlso”等。
- (3)RDF Syntax
RDF Schema以XML為其宿主語言,通過XML語法實現對各種元數據的集成。目前最新的語法規範是2004年W3C推薦的RDF/XML語法規範。
RDF/XML能夠表達由多個陳述語句所組成的RDF圖(即RDF數據模型),其基本思想是將RDR圖編碼為元素、屬性、元素內容和屬性值。其基本方法是:RDF/xML使用XML限定名(XML QNames)來標識數據模型中謂語結的URI引用(URIreferences,簡寫為URIrefs)。限定名有一個命名空間名稱,由一個URI引用和一個短的本地名稱組成。此外,限定名可以有一個短首碼,或者有預設的命名空間聲明。再把主語結的URIrefs寫作XML屬性值(賓語的URIrefs有時也可能被寫作屬性值)。字面值結(一般是賓語結)則作為原始文本內容或者屬性值。
資源描述框架的核心數據模型[1]
RDF是使用XML進行表達的通用元數據結構,它的數據模型能為電腦執行編碼提供一致的語義表達方式。核心數據模型包括三個對象類型:資源(Resource)、屬性(Property)和陳述(Statement)。
- 1.資源
資源是指任何可由RDF所描述的對象,包括所有在Web上被命名、具有URl(Unified Resource Identifier,統一資源描述符)的信息,如Web站點、網頁、XML文檔中的元素等,也可以包括非網路上的信息,如印刷本書刊等。資源一般以統一資源標識符(URL)來標識。
- 2.屬性
在RDF模型里,屬性是指與描述資源有關的特征或關係,屬性包括屬性類型(Property-Type)和屬性值(Property-Value)。每個屬性表述相關資源的單個元數據屬性。每一個資源都有屬性和具有特定意義的屬性值,包括資源的外觀、特點、性質、與其他資源之間的關係等,一個資源可以有一個或多個不同含義的屬性。
- 3.陳述
陳述是指描述特定資源的語句集合。一個資源描述由多個語句構成,一個語句是由資源、屬性類型、屬性值構成的三元體,表示資源具有的一個特定屬性。與自然語言相比較,資源對應於主語,屬性類型對應於謂語,屬性值對應於賓語。其中,屬性值可以是一個資源,該資源同樣可以有多個屬性。另外,也可以將—個語句看作是一個資源,該資源再和一個或幾個屬性相連。這樣,RDF可以通過信息資源的相互鏈接而不斷地增大。因此,RDF數據模型的描述能力是十分強大的,可以描述現實世界任意複雜的信息對象。
資源描述框架的集合數據模型[1]
集合數據模型用於描述資源及其屬性值集合的情況,RDF定義了三種不同類型的集合。
- 1.無序序列
無序序列稱為Bag,它包含一組資源,在無序序列中資源的次序不分先後。Bag通常用在一個屬性有多個值的情況下,而這幾個值的先後順序並不重要,例如通訊錄可能包含了許多姓名。Bag可以不包含值,也可以有多個重覆的值。
- 2.有序序列
有序序列稱為Sequence,它也包含一組資源;然而,在有序序列裡面的資源的順序是很重要的。在一個屬性有多個值並且這些值依賴於資源的順序時使用有序序列。例如,一本書作者在一個以上,可能有必要區分出主要作者、次要作者。有序序列可以不包含值,也可以有多個重覆的值。
- 3.可選序列
可選序列稱為altemative,可選序列提供屬性值的選項。可選序列類似於其它序列包含了一組資源。與無序序列和有序序列的主要差別是可選序列為單個屬性提供一套可選值,例如某個軟體可能提供許多個下載網址。可選序列所包含的值要在一個以上,而第一個值是預設值。
資源描述框架的關鍵技術[1]
在進行資源描述時,RDF使用了兩種關鍵技術。一是URI。URI作為Web資源的唯一標識,它不但可以標識網頁,它還可以標識頁面上的元素、書籍、音頻、視頻等資源。在RDF中,資源的屬性是資源,屬性值可以是資源,甚至一個陳述也可以是資源。這就是說,所有這些都可以用URl標識,再用RDF來描述。二是XML。RDF採用XML作為交換和處理元數據的通用語法,來建立語義和語法之間的聯繫,以實現各種不同體系元數據之間的互操作性,這樣就可以方便地用XML格式來交換RDF的數據。