模型基編碼

模型基編碼

模型基編碼(Model-Based Coding),也稱知識基編碼,最早是由瑞典的Forchheimer和Parke及後來日本的Aizawa,Harashima提出的。模型基,也就是基於模型的,它是一種綜合圖像分析和計算機圖形學高效的壓縮編碼方法。

基本介紹

  • 中文名:模型基編碼
  • 外文名:Model-Based Coding
  • 提出者:Forchheimer,Parke等
  • 用途:用於圖像壓縮
基本思想,模型基編碼的核心,與經典方法的異同,模型基編碼的分類,

基本思想

模型基編碼方法的思想是:首先,在編、解碼兩端分別建立相同的模型。在傳送端,利用圖像分析模組對輸入圖像提取景物的參數,如形狀參數、運動參數等。在接收端,景物的這些參數被編碼後通過信道傳輸到解碼端,由解碼器接收到的參數利用圖像合成技術在重建圖像,基本原理如圖1-1所示。
圖1-1基於模型的圖像編碼基本原理框圖圖1-1基於模型的圖像編碼基本原理框圖

模型基編碼的核心

模型基方法編碼的核心是建模和提取模型參數,其中模型的選取、描述和建立是決定模型編碼質量的關鍵因素。

與經典方法的異同

與經典方法中的預測編碼方法類似,基於模型的編碼在傳送端既有分析作用的編碼器,同時又有綜合作用的解碼器。只有這樣,在傳送端才能獲得與接收端相同的綜合後的重建圖像,並將後者與原始圖像進行“比較”,以確定圖像失真是否低於“某種閾值”,以便修正模型參數。
但是,模型基編碼與傳統的編碼方式有本質的不同。它不是把圖像信號作為一個統計模型來考慮,而是作為一個結構模型,利用結構化的方式來描述圖像的組成,需要對圖像的內容有所了解。該方法認為編碼的圖像具有邊界、輪廓和區域等結構信息,在低碼率編碼時給予保留,因此能使恢復的圖像維持較高的視覺質量,有效地克服了傳統編碼方式在低碼率下產生嚴重方塊效應等問題,是一種在低碼率條件下高質量壓縮圖像的方法。
同經典方法比較,給予模型的編碼還有兩點顯著不同:一是編碼失真。基於模型的編碼所引起的失真已從傳統方法的量化誤差轉化為幾何失真,並可能進一步轉化為物理失真或行為失真;二是如何評價重建圖像質量。傳統的以像素為單位計算圖像與重建圖像之間“逼真度”(如均方誤差信噪比)不能測量幾何失真和物理失真等,從原理上講根本不適用於基於模型的編碼。

模型基編碼的分類

目前,已有許多基於模型的圖像編碼方法,例如,物體基編碼,知識基編碼,語義基編碼,分析綜合編碼。根據圖像內容先驗知識的使用程度,模型基編碼可以分為兩類。一類是基於語義的圖像編碼,它是基於限定景物的模型編碼,其中景物內圖像的三維模型是嚴格已知的;另一類是基於物體的圖像編碼,它是針對未知物體的模型編碼,需要實時構造物體的模型。
這兩類編碼方法各有優缺點。基於語義的方法可以有效地利用景物中已知物體的知識,獲得非常高的壓縮比,但它僅能處理已知物體並需要模式識別。基於物體的方法由於不需要模式識別,其圖像分析要簡單許多,但因為沒有充分利用景物的知識,或只能在低層次上利用物體知識,所以其編碼效率與基於語義的方法相比低很多。

相關詞條

熱門詞條

聯絡我們