數據冗餘

用手机看条目

出自 MBA智库百科(https://wiki.mbalib.com/)

數據冗餘(Data Redundancy/Redundant Data)

目錄

什麼是數據冗餘

  數據冗餘是指同一個數據系統中多次重覆出現。在文件系統中,由於文件之間沒有聯繫,有時一個數據在多個文件中出現;而資料庫系統則剋服了文件系統的這種缺陷,但仍然存在數據冗餘問題。[1]消除數據冗餘的目的是為了避免更新時可能出現的問題,以便保持數據的一致性。[2]

數據冗餘的類型[3]

  一般而言圖像、視頻、音頻數據中存在的數據冗餘類型主要有以下一些:

  ①空間冗餘:圖像數據中所經常出現的一種冗餘。在同一幅圖像中,規則物體和規則背景(所謂規則是指錶面是有序的而不是完全雜亂無章的排列)的錶面物理特性具有相關性,數字化圖像中表現為數據冗餘。例如一幅靜態圖像中的一大片藍天、草地,其中每個像素的數據完全相同,如果逐點存儲,就會產生所謂的空間冗餘。完全一樣的數據當然可以壓縮,十分接近的數據也可以壓縮,因為被壓縮的數據恢復後人眼也分辨不出與原來的圖片有什麼區別,這種壓縮就是對空間冗餘的壓縮。

  ②時間冗餘:這是序列圖像(電視圖像、運動圖像)和語音數據中所經常包含的冗餘。在電視、動畫圖像中,在相鄰幀之間往往包含了相同的背景,只不過運動物體的位置略有變換。因此對於序列圖像中的相鄰兩幀僅記錄它們之間的差異,去掉其中重覆的,稱為時間冗餘的那部分信息。同樣,由於人在說話時產生的音頻也是連續和漸變的,因此聲音信息中也會存在時間冗餘。

  ③結構冗餘:有些圖像從大體上看存在著非常強的紋理結構,例如草席圖像,我們稱之為它在結構上存在冗餘。

  ④知識冗餘:有許多圖像的理解與某些基礎知識有相當大的相關性。例如:人臉的圖像有固定的結構。比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位於臉的中線上等等。這類規律性的結構可由先驗知識和背景知識得到,稱之為知識冗餘。⑤視覺冗餘:是由於人體器官的不敏感性造成的。例如在高亮度下,人的視覺靈敏度下降,對灰度值的表示就可以粗糙一些。對於太強太弱的聲音,如果超出了“閾值”,人們聽覺感受也會被掩蔽。利用感官上的這些特性,也可以壓縮掉部分數據而不被人們感知(覺察)。

  ⑥信息熵冗餘:又可稱為編碼冗餘,是指一組數據攜帶的平均信息量。正因為多媒體數據中存在著上述的各種各樣的冗餘,所以多媒體數據是可以被壓縮的。針對不同的冗餘,人們已經提出各種各樣的方法實施對於多媒體數據的壓縮。

增加數據冗餘的目的[4]

  一般情況下,應儘量減少數據冗餘,保證數據的一致性,但在某些情況下,也需要適當增加數據冗餘度。

  1、重覆存儲或傳輸數據以防止數據的丟失。

  2、對數據進行冗餘性的編碼來防止數據的丟失、錯誤,並提供對錯誤數據進行反變換得到原始數據的功能。

  3、為方便處理而使同一信息在不同地點有不同的表現形式,如一本書的不同語言的版本。

  4、為了提高數據的檢索速度。

  數據冗餘或者信息冗餘是生產、生活所必然存在的行為,沒有好與不好的總體傾向。

相關條目

參考文獻

  1. 李天博主編.第四章 資料庫技術 電腦軟體技術基礎.東南大學出版社,2011.02.
  2. 高洪深著.決策支持系統(DSS)理論·方法·案例.清華大學出版社,2005年05月第3版.
  3. 楊貴茂著.大學電腦基礎.北京郵電大學出版社,2010.01.
  4. 陳立潮主編;張淼,南志紅副主編.資料庫技術及應用 SQL Server.高等教育出版社,2010.08.
本條目對我有幫助14
MBA智库APP

扫一扫,下载MBA智库APP

分享到:
  如果您認為本條目還有待完善,需要補充新內容或修改錯誤內容,請編輯條目

本条目由以下用户参与贡献

方小莉,Sdgfhtjy.

評論(共2條)

提示:評論內容為網友針對條目"數據冗餘"展開的討論,與本站觀點立場無關。
222.216.169.* 在 2014年10月14日 14:01 發表

呵呵

回複評論
111.117.112.* 在 2017年3月7日 14:25 發表

有些片面

回複評論

發表評論請文明上網,理性發言並遵守有關規定。

MBA智库
打开APP

以上内容根据网友推荐自动排序生成