數據冗餘
出自 MBA智库百科(https://wiki.mbalib.com/)
數據冗餘(Data Redundancy/Redundant Data)
目錄 |
數據冗餘是指同一個數據在系統中多次重覆出現。在文件系統中,由於文件之間沒有聯繫,有時一個數據在多個文件中出現;而資料庫系統則剋服了文件系統的這種缺陷,但仍然存在數據冗餘問題。[1]消除數據冗餘的目的是為了避免更新時可能出現的問題,以便保持數據的一致性。[2]
數據冗餘的類型[3]
一般而言圖像、視頻、音頻數據中存在的數據冗餘類型主要有以下一些:
①空間冗餘:圖像數據中所經常出現的一種冗餘。在同一幅圖像中,規則物體和規則背景(所謂規則是指錶面是有序的而不是完全雜亂無章的排列)的錶面物理特性具有相關性,數字化圖像中表現為數據冗餘。例如一幅靜態圖像中的一大片藍天、草地,其中每個像素的數據完全相同,如果逐點存儲,就會產生所謂的空間冗餘。完全一樣的數據當然可以壓縮,十分接近的數據也可以壓縮,因為被壓縮的數據恢復後人眼也分辨不出與原來的圖片有什麼區別,這種壓縮就是對空間冗餘的壓縮。
②時間冗餘:這是序列圖像(電視圖像、運動圖像)和語音數據中所經常包含的冗餘。在電視、動畫圖像中,在相鄰幀之間往往包含了相同的背景,只不過運動物體的位置略有變換。因此對於序列圖像中的相鄰兩幀僅記錄它們之間的差異,去掉其中重覆的,稱為時間冗餘的那部分信息。同樣,由於人在說話時產生的音頻也是連續和漸變的,因此聲音信息中也會存在時間冗餘。
③結構冗餘:有些圖像從大體上看存在著非常強的紋理結構,例如草席圖像,我們稱之為它在結構上存在冗餘。
④知識冗餘:有許多圖像的理解與某些基礎知識有相當大的相關性。例如:人臉的圖像有固定的結構。比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位於臉的中線上等等。這類規律性的結構可由先驗知識和背景知識得到,稱之為知識冗餘。⑤視覺冗餘:是由於人體器官的不敏感性造成的。例如在高亮度下,人的視覺靈敏度下降,對灰度值的表示就可以粗糙一些。對於太強太弱的聲音,如果超出了“閾值”,人們聽覺感受也會被掩蔽。利用感官上的這些特性,也可以壓縮掉部分數據而不被人們感知(覺察)。
⑥信息熵冗餘:又可稱為編碼冗餘,是指一組數據攜帶的平均信息量。正因為多媒體數據中存在著上述的各種各樣的冗餘,所以多媒體數據是可以被壓縮的。針對不同的冗餘,人們已經提出各種各樣的方法實施對於多媒體數據的壓縮。
增加數據冗餘的目的[4]
一般情況下,應儘量減少數據冗餘,保證數據的一致性,但在某些情況下,也需要適當增加數據冗餘度。
1、重覆存儲或傳輸數據以防止數據的丟失。
2、對數據進行冗餘性的編碼來防止數據的丟失、錯誤,並提供對錯誤數據進行反變換得到原始數據的功能。
3、為方便處理而使同一信息在不同地點有不同的表現形式,如一本書的不同語言的版本。
4、為了提高數據的檢索速度。
數據冗餘或者信息冗餘是生產、生活所必然存在的行為,沒有好與不好的總體傾向。
呵呵