基於紋理建模的預測編碼技術研究

基於紋理建模的預測編碼技術研究

《基於紋理建模的預測編碼技術研究》是依託武漢大學,由韓鎮擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於紋理建模的預測編碼技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:韓鎮
  • 依託單位:武漢大學
項目摘要,結題摘要,

項目摘要

基於紋理分析與合成的視頻編碼利用人眼的掩蔽效應,用易於壓縮但人眼察覺不到區別的合成圖像來替換圖像中難於壓縮的紋理區域,成為視頻編碼領域技術發展趨勢之一。但是由於目前還無法自動的提取出人眼不關注的紋理區域,導致該方法並不具備通用性。本課題基於該領域中發展相對成熟的紋理合成技術,將其無縫引入到傳統視頻編碼框架中的預測編碼環節,提出基於紋理建模的預測編碼技術。針對幀內預測,提出基於圖像摘要的幀內預測技術,提高當前的幀內預測效率;針對幀間預測,採用基於動態紋理的虛擬幀技術彌補當前多參考幀技術對包含不規則運動、光照變化內容圖像在幀間預測效率不高的缺陷;基於局部時空紋理模型提出改進的幀間預測技術,減少碼流中運動矢量等邊信息的編碼比特數。預期本研究能形成與傳統混合視頻編碼框架兼容的增強編碼工具集,在同等主/客觀質量下,編碼效率提升10%。

結題摘要

基於紋理分析與合成的視頻編碼成為視頻編碼領域技術發展趨勢之一。本課題基於紋理合成技術,將其無縫引入到傳統視頻編碼框架中的預測編碼環節,對基於紋理建模的預測編碼技術展開研究。 (1)基於圖像摘要的幀內預測編碼技術 針對當前方向幀內預測編碼模式有限、預測來源單一的問題,本項目將計算機圖形學領域的反向紋理合成模型引入混合視頻編碼技術中,首次提出了基於圖像摘要的幀內預測編碼框架,分析了壓縮導向的圖像摘要生成方式,在給定的圖像摘要情況下,編碼塊的預測可由圖像摘要生成,編碼傳輸原始圖像與圖像摘要之間的映射關係以及提取出來的圖像摘要。為了實現該種編碼思想,本項目設計了兩種新的幀內預測模式,並套用於實際的H.264/AVC編碼中。 (2)基於動態紋理模型的虛擬幀技術 基於傳統動態紋理模型合成的圖像雖然主觀效果較好,但是由於合成圖像與當前待預測幀的相關性較低,降低了幀間預測效率。雖然有學者提出了改進的求解方法,但是為了保證編/解碼端的數據匹配而省略噪聲項,使得動態紋理模型沒有了噪聲驅動項,理論上導致模型無法驅動。針對這一問題,本項目提出一種改進的動態紋理模型求解方法,通過引入偽隨機函式作為模型驅動項,採用逐幀更新疊代的方法使得合成的虛擬幀具有更小的圖像合成誤差值。在此基礎上,在編碼端提出一種虛擬幀算法,改善了現有多參考幀預測技術對於非線性運動、背景光照變化時預測效率不高的影響。 (3)基於STALL模型的幀間預測算法 原始STALL紋理模型以像素點為基本處理單元、形成逐點合成的處理框架,而現有視頻編碼標準採用基於塊的處理框架(如H.264標準以4×4塊為最小處理單元)。將STALL模型用在基於塊為最小處理單元的視頻標準有損壓縮時,由於空域鄰居點無法實時獲取到,只能利用時域鄰居點信息來建模,降低了模型預測精度。針對這一問題,本項目提出以4×4塊為處理單元的時空鄰居點自適應選擇方法,建立適合視頻有損壓縮的改進STALL模型,提出了一種新的幀間預測模式,提高了幀間預測精度。 完成上述研究的過程中,本項目團隊發表論文14篇,申請國家發明專利6項。相關編碼技術在國家科技重大專項中套用。

相關詞條

熱門詞條

聯絡我們