多媒體數據壓縮技術

多媒體數據之所以能夠壓縮,是因為視頻、圖像、聲音這些媒體具有很大的壓縮力。以目前常用的點陣圖格式的圖像存儲方式為例,在這種形式的圖像數據中,像素與像素之間無論在行方向還是在列方向都具有很大的相關性,因而整體上數據的冗餘度很大;在允許一定限度失真的前提下,能對圖像數據進行很大程度的壓縮。

基本介紹

  • 中文名:多媒體數據壓縮技術
  • 原因:視頻、圖像、聲音具有很大壓縮力
  • 常用方式點陣圖格式的圖像存儲
  • 前提:允許一定限度失真
介紹,方法分類,失真分類,原理分類,

介紹

在多媒體計算系統中,信息從單一媒體轉到多種媒體;若要表示,傳輸和處理大量數位化了的聲音/圖片/影像視頻信息等,數據量是非常大的。例如,一幅具有中等解析度(640*480像素)真彩色圖像(24位/像素),它的數據量約為每幀7.37Mb。若要達到每秒25幀的全動態顯示要求,每秒所需的數據量為184Mb,而且要求系統的數據傳輸速率必須達到184Mb/s,這在目前是無法達到的。對於聲音也是如此。若用16位/樣值的PCM編碼,採樣速率選為44.1kHz,則雙聲道立體聲聲音每秒將有176KB的數據量。由此可見音頻、視頻的數據量之大。如果不進行處理,計算機系統幾乎無法對它進行存取和交換。因此,在多媒體計算機系統中,為了達到令人滿意的圖像、視頻畫面質量和聽覺效果,必須解決視頻、圖像、音頻信號數據的大容量存儲和實時傳輸問題。解決的方法,除了提高計算機本身的性能及通信信道的頻寬外,更重要的是對多媒體進行有效的壓縮。

方法分類

數據的壓縮實際上是一個編碼過程,即把原始的數據進行編碼壓縮。數據的解壓縮是數據壓縮的逆過程,即把壓縮的編碼還原為原始數據。因此數據壓縮方法也稱為編碼方法。數據壓縮技術日臻惱,適應各種套用場合的編碼方法不斷產生。針對多媒體數據冗餘類型的不同,相應地有不同的壓縮方法。

失真分類

根據解碼後數據與原始數據是否完全一致進行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。
有失真壓縮法會壓縮了熵,會減少信息量,而損失的信息是不能再恢復的,因此這種壓縮法是不可逆的。無失真壓縮法去掉或減少數據中的冗餘,但這些冗餘值是可以重新插入到數據中的,因此冗餘壓縮是可逆的過程。
無失真壓縮是不會產生失真。從信息主義角度講,無失真編碼是泛指那種不考慮被壓縮信息性質和壓縮技術。它是基於平均信息量的技術,並把所有的數據當作比特序列,而不是根據壓縮信息的類型來最佳化壓縮。也就是說,平均信息量編碼忽略被壓縮信息主義內容。在多媒體技術中一般用於文本、數據的壓縮,它能保證百分之百地恢復原始數據。但這種方法壓縮比較低,如LZW編碼、行程編碼、霍夫曼(Huffman)編碼的壓縮比一般在2:1至5:1之間。

原理分類

根據編碼原理進行分類,大致有編碼、變換編碼、統計編碼、分析-合成編碼、混合編碼和其他一些編碼方法。其中統計編碼是無失真的編碼,其他編碼方法基本上都是有失真的編碼。
預測編碼是針對空間冗餘的壓縮方法,其基本思想是利用已被編碼的點的數據值,預測鄰近的一個像素點的數據值。預測根據某個模型進行。如果模型選取得足夠好的話,則只需存儲和傳輸起始像素和模型參數就可代表全部數據了。按照模型的不同,預測編碼又可分為線性預測、幀內預測幀間預測
變換編碼也是針對空間冗餘和時間冗餘的壓縮方法。其基本思想是將圖像的光強矩陣(時域信號)變換到系統空間(頻域)上,然後對系統進行編碼壓縮。在空間上具有強相關性的信號,反映在頻域上是某些特定區域內的能量常常被集中在一起,或者是係數矩陣的發布具有某些規律。可以利用這些規律,分配頻域上的量化比特數,從而達到壓縮的目的。由於時域映射到頻域總是通過某種變換進行的,因此稱變換編碼。因為正交變換的變換矩陣是可逆的,且逆矩陣與轉換置矩陣相等,解碼運算方便且保證有解,所以變換編碼總是採用正交變換。
統計編碼屬於無失真編碼。它是根據信息出現機率的分布而進行的壓縮編碼。編碼時某種比特或位元組模式的出現機率大,用較短的碼字表示;出現機率小,用較長的碼字表示。這樣,可以保證總的平均碼長最短。最常用的統計編碼方法是哈夫曼編碼方法。
分析-合成編碼實質上都是通過對原始數據的分析,將其分解成一系列更適合於表示“基元”或從中提取若干具有更為本質意義的參數,編碼僅對這些基本單元或特徵參數進行。解碼時則藉助於一定的規則或模型,按一定的算法將這些基元或參數,“綜合”成原數據的一個逼近。這種編碼方法可能得到極高的數據壓縮比。
混合編碼綜合兩種以上的編碼方法,這些編碼方法必須針對不同的冗餘進行壓縮,使總的壓縮性能得到加強。

相關詞條

熱門詞條

聯絡我們