數據元

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

數據元(Data Element)

目錄

什麼是數據元

  數據元即數據元素,是通過定義標識、表示和允許值等一系列屬性描述的數據單元,在一定語境下,構建一個語義正確、獨立且無歧義的特定概念語義的信息單元。數據元可理解為數據的基本單元,將若幹具有相關性的數據元按一定次序組成一個整體結構,即數據模型[1]

數據元的組成[1]

  數據元由對象類、特性和表示3部分組成,具體如下:

  1)對象類(object class):是現實世界或抽象概念中事物的集合,有清楚的邊界和含義,因其特性和行為遵循同樣的規則而能加以標識;是所要研究、收集和存儲其相關數據的實體,如人員、設施、裝備、組織、環境和物資等;

  2)特性(property):是對象類的所有個體所共有的某種性質,也是對象有別於其他成員的依據,是用來區分和識別事物的一種手段,如人員的姓名、性別、身高、體重和職務,坦克的型號、口徑、高度、長度和有效射程等;

  3)表示(representation):是值域、數據類型和表示方式的組合,也包括計量單位和字元集等信息。表示是數據元表達方式的一種描述。表示的任何一個組成發生變化將產生不同的表示,如人員的身高用“cm”或用“m”計量,是人員身高特性的兩種不同表示。數據元的表示可用表示含義的術語標記,如名稱、代碼、金額、數量、日期和百分比等。

數據元的基本模型[1]

  數據元基本模型如圖1所示。

图1:数据元基本模型
放大
圖1:數據元基本模型

  數據元基本模型中,對象類對應於數據模型中的實體,特性和表示對應於數據模型中的屬性。圖1中的數據元概念和通用數據元含義如下:

  1)數據元概念(data element concept):能以數據元形式表示且與任何特定表示無關的一種概念。1種數據元概念由1個對象類和1個特性組成,它與特定的表示無關;1種數據元概念與1個特定的表示結合就成為1個數據元。數據元概念與數據元是1對多的關係,即1個數據元概念可以與多種不同的表示方式結合,組成多個數據元。如人員性別是1個數據元概念,而人員性別名稱和人員性別代碼是表示該數據元概念的2個數據元。計量單位也是數據元概念的一種表示方式,1種數據元概念採用不同的計量單位表示就產生多個不同的數據元。如坦克全重是1個數據元概念,採用“t”表示和“kg”表示的坦克全重是2個不同的數據元。

  2)通用數據元(common data element):獨立於任何具體應用而存在的數據元,其主要功能是為應用領域內的數據元設計者提供通用數據元模板。1個通用數據元由1個特性和該特性的1個表示組成,它與特定對象類無關;把1個通用數據元應用於1個特定的對象類時,則與該對象類組成1個數據元。通常,各領域和行業所制定的公用數據元目錄中收錄數據元均為通用數據元。通用數據元可用於制定數據元的模板,在數據模型設計時,從公共數據元目錄中提取合適的通用數據元與給特定對象類結合可形成1個完整的數據元。

數據元與元數據的區別和聯繫[2]

  (1)元數據不可能涵蓋理解數據元所要表示的數據所必需的所有信息。例如,一個收集調查資料的組織將會有許多關於如何收集數據的信息。這些諸如樣本和問卷設計等常常是理解數據所必要的。但是,樣本和問卷設計並不是用來表示和描述數據元的元數據的一部分(源自GB/T18391)。

  (2)數據元的相關信息是任何一個(組織的)元數據的一個完整的組成部分。GB廠I1l8391.2至GB/T18391.6是這樣描述元數據的:一個組織的數據元必須具備元數據。這些元數據將便於用戶理解和共用該組織的數據。

  (3)元數據的每一個元素都是一個數據元,用符合數據元標準的元數據屬性和描述方法來說明元數據。

  (4)將元數據存儲於一個庫中,並使之條理化就需要建模,建模就需要從數據元的註冊系統中或庫中獲取元數據。

  (5)元數據,它是以一種一致、標準的方式來表達的數據元。

  (6)元數據與數據元字典格式均由行號、中文名稱、英文名稱、標識符(短語)、定義、約束/條件、最大出現次數、數據類型、數據的值域等屬性組成。不同之處是數據元字典格式中另有語境和同義詞名稱等屬性。

  結論:元數據和數據元的定義是從不同角度論述的。由於描述的側重面不同,元數據和數據元的描述屬性也有些區別,但是元數據和數據元的字典格式是基本一致的。有些標準文本中把數據元字典格式稱為數據元目錄,書寫格式不是二維表格形式,不論如何稱謂和不同的表示形式,其描述屬性是基本相同的。例如,在農村科技信息共用平臺的數據元字典(目錄)格式中,每一個數據元用11個描述屬性:行號、中文名稱、英文名稱、標識符、定義、同義名稱/標識符、語境(資料庫)、約束條件、出現次數、數據類型、數據值域。而在科學數據共用技術標準中的元數據字典格式有9個屬性。這9個屬性兩者完全一致,不同之處,前者增加了同義名稱/標識符和語境(資料庫)兩個屬性,使之更具有實用性。從元數據和數據元的規範用於實現數據共用的角度出發,兩者也沒有差異。不論是元數據的應用或數據元的應用,在本文統一用元數據的應用來描述。

相關條目

參考文獻

  1. 1.0 1.1 1.2 靳大尉,趙成.數據元內涵及標準化(A).指揮信息系統與技術.2013,4(3):40~41
  2. 王丹,王文生.元數據與數據元的內涵及其應用(D).北京:中國農業科學院.2005
本條目對我有幫助6
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目

本条目由以下用户参与贡献

Mis铭,Jason.

評論(共1條)

提示:評論內容為網友針對條目"數據元"展開的討論,與本站觀點立場無關。
106.38.59.* 在 2017年8月9日 15:04 發表

啥時走

回複評論

發表評論請文明上網,理性發言並遵守有關規定。

打开APP

以上内容根据网友推荐自动排序生成

闽公网安备 35020302032707号