數據壓縮
出自 MBA智库百科(https://wiki.mbalib.com/)
- 數據壓縮(Data Compression)
目錄 |
什麼是數據壓縮[1]
數據壓縮是以儘可能少的數位來表示信源所發出的信號,減少容納給定的消息集合或數據採樣集合的信號空間。這裡講的信號空間,就是被壓縮的對象,是指某信號集合所占的時域、空域和頻域。信號空間的這幾種形式是相互關聯的,存儲空間的減少,意味著信號傳輸效率的提高,所占用帶寬的節省。只要採取某種方法來減少某個信號空間,就能夠壓縮數據。
數據壓縮是資訊理論中一個很重要的概念。從資訊理論的角度來看,信源編碼的一個最主要的目的,就是要解決數據的壓縮問題。這一點,反映在整個通信過程中。
數據壓縮的基本原理[1]
一般來說,數據壓縮主要是通過數據壓縮編碼來實現的。要想使編碼有效,必須建立相應的系統模型。在給定的模型下,通過數據編碼來消除冗餘,大致有如下三種情況。
(1)信源符號之間存在相關性。如果消除了這些相關性,就意味著數據壓縮。譬如,點陣圖圖像像素與像素之間的相關性,動態視頻幀與幀之間的相關性。去掉這些相關性,通常採用預測編碼、變換編碼等方法。
(2)信源符號之間存在分佈不等概性。根據不同符號出現的不同概率,分別進行編碼,概率大的符號用較短的碼長編碼,概率小的符號用較長的碼長編碼,最終使信源的平均碼長達到最短。對此,通常採用統計編碼的方法。
(3)利用信息內容本身的特點(如自相似性)。用模型的方法,對需傳輸的信息進行參數估測,充分利用人類的視覺、聽覺等特性,同時考慮信息內容的特性,確定並遴選出其中的部分內容(而不是全部內容)進行編碼,從而實現數據壓縮。通常採用模型基編碼的方法。
隨著數字通信和電腦技術的不斷發展,有關數據壓縮的技術正不斷成熟和完善,而且適應各種應用的新的編碼方法也不斷產生。一般說來,可供壓縮的數據分為兩大類:一類是與文字和字元有關的文本數據;另一類是將模擬信號數字化後得到的多媒體數據。兩類數據所採用的數據壓縮方法相應不同。此外,文本數據壓縮和多媒體數據壓縮(如視覺類和聽覺類媒體)在演算法上存在一定區別,主要表現在兩個方面:是否允許有誤差;壓縮演算法有沒有高級模型可以利用。
數據壓縮的基本方法[1]
目前,比較認同的常用的數據壓縮的編碼方法,大致分為兩大類。
(1)冗餘壓縮法或無損壓縮法。
冗餘壓縮法或無損壓縮法又稱為無失真壓縮法或熵編碼法。這類壓縮方法只是去掉數據中的冗餘部分,並沒有損失熵,而這些冗餘數據是可以重新插入到原數據中的。也就是說,去掉冗餘不會減少信息量,而且仍可原樣恢複數據。因此,這類壓縮方法是可逆的。
(2)熵壓縮法或有損壓縮法。
這類壓縮法由於壓縮了熵,也就損失了信息量,而損失的信息是不能恢復的。因此,在用門限值來採樣量化時,如果只存儲門限內的數據,那麼原來超過這個預置門限的數據就將丟失。這種壓縮方法,雖然可壓縮大量的信號空間,但那些丟失的實際樣值就不可能恢復了,是不可逆的。也就是說,在用熵壓縮法時,數據壓縮要以一定的信息損失為代價,而數據的恢復只能是近似的,應根據條件和要求,在允許的範圍內進行壓縮。
數據壓縮的分類[2]
數據壓縮按照映射是否固定可分為靜態數據壓縮和動態數據壓縮。靜態數據壓縮是指壓縮前源消息集到碼字集之間的映射是固定的,出現在被壓縮數據中的源消息每次都被映射為同一碼字。動態數據壓縮是指源消息集到碼字集的映射會隨著壓縮進度的變化而變化。靜態壓縮編碼需要兩步,先計算出源消息出現的頻率,確定源消息到碼字之間的映射;然後完成映射。動態數據壓縮則只需一步就能完成,它在壓縮過程中只對源消息集掃描一次。有些數據壓縮演算法是混合型的,綜合應用了靜態數據壓縮和動態數據壓縮技術。
評價數據壓縮的標準[2]
從實際應用來說,數據壓縮可從數據壓縮速度和數據壓縮率兩方面來衡量。當數據壓縮應用於網路傳輸時,主要考慮速度快慢;當數據壓縮應用於數據存儲時,主要考慮壓縮率,即壓縮後數據的大小。當然這兩方面是相輔相成的。
常用的評價標準有冗餘度、平均源信息長度、壓縮率等。對於一種編碼方式是否為較好的編碼,主要看該編碼的冗餘度是否最小。
常見的數據壓縮工具[2]
現在操作簡單、使用方便、功能強大的數據壓縮工具有很多。最常見的是WinZip和Win-RAR。
數據壓縮的國際標準[3]
20世紀80年代.國際標準化組織(ISO)和國際電報電話咨詢委員會(CCITT)組成的聯合圖像專家組制定的靜止圖像壓縮標準JPEG和運動圖像視頻壓縮標準MPEG已被廣泛採用。
- 1.JPEG標準
JPEG標準適用於色調和多級灰度的靜態圖像,一般對單色和彩色圖像的壓縮比通常分別為10:1和15:1,常用於CD—ROM、彩色圖像傳真和圖文管理。許多Web瀏覽器都將JPEG圖像作為其標準的圖像文件格式。
- 2.MPEG標準
MPEG標準不僅適用於運動圖像,也適用於音頻信息,它包括了三部分:MPEG視頻、MPEG音頻、MPEG系統(視頻和音頻的同步)。MPEG視頻是MPEG標準的核心。MPEG標準已指定了MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21等多種標準。
MPEG-1是為有限帶寬傳輸設計的,數據傳輸率為l~1.5Mb/s,平均壓縮比為50:1,可達到一般錄像機所要求的質量。它常用於VCD壓縮,一部120分鐘長的電影可壓縮到1.2GB左右。
MPEG-2是為高帶寬傳輸設計的,數據傳輸率為4~10Mb/s,壓縮比高達200:1,可支持播放高質量的數字式電視,常用於DVD壓縮。MPEG-4是“甚低速率視聽編碼”標準,數據傳輸率小於64Kb/s。多應用在移動多媒體通信、網際網路、實時多媒體監控以及其他低數據傳輸速率的場合。
- 3.H.261視頻通信編碼標準
國際電報電話咨詢委員會於1988年針對可視通信的需要,提出電視電話/會議的H.261編碼標準,即P*64視頻編碼/解碼標準。這是一種關於視頻和聲音的以64kb/s的整數倍作為傳輸速率的雙向傳輸標準。其中P是一個通道可變參數,取值為1~30。當P=1或P=2時支持四分之一中間格式(QCIF)的幀率較低的視頻電話傳輸;當P≥6時支持能用中間格式(CIF)的幀率較高的電視會議數據傳輸。
在H.261標準中,圖像採用公共中間格式CIF和1/4CIF,H.261標準與MPEG標準是相互不兼容的。
謝謝