統計冗餘

從資訊理論的觀點來看,描述信源的數據是信息和數據冗餘之和,即:數據=信息+數據冗餘。統計冗餘是圖像數據中經常存在的一種數據冗餘。

定義,處理技術,

定義

對於一串由許多數值構成的數據來說,如果其中某些值經常出現,而另外一些值很少出現,那么,這種由於取值上統計的不均勻性就構成了統計冗餘。

處理技術

針對統計冗餘,通常採用什麼技術進行處理呢?最常用的是熵編碼壓縮技術。熵編碼的主要思想是這樣的:在一串由許多數值構成的數據中,對那些經常出現的值用短的碼組來表示,對不經常出現的值用長的碼組來表示,從而最終用於表示這一串數據的總的碼位,相對於用固定長度碼組來表示的碼位而言得到了降低。目前用於圖像壓縮的具體的熵編碼方法主要是霍夫曼編碼,即一個數值的編碼長度與此數值出現的機率儘可能地成反比。霍夫曼編碼是熵編碼理論里的最優編碼,理論上是壓縮比最高的無損壓縮方式,在圖像壓縮編碼中被廣泛採用。(無損壓縮是指用壓縮後的數據進行重構即解壓縮時,重構後的數據與原來的數據完全相同,從數學上講是一種可逆運算。具體講就是解碼圖像和壓縮編碼前的圖像嚴格相同,沒有失真。)
另外,對於視頻圖像中經常出現的一連串連續的像素點具有相同值的情況,典型的如彩條、彩場信號等,還有一種常用的處理辦法:傳輸時,只傳輸起始像素點的值以及隨後取相同值的像素點的個數。這種辦法也可以有效地壓縮碼率,這就是行遊程編碼技術,它屬於無損壓縮。不過,在圖像壓縮編碼中,行遊程編碼通常並不直接對圖像數據進行編碼,而是主要用於對量化後的DCT(Discrete Cosine Transform,離散餘弦變換)係數進行編碼。

相關詞條

熱門詞條

聯絡我們