基於知識域與數據域協同的圖像壓縮算法研究

《基於知識域與數據域協同的圖像壓縮算法研究》是依託北京航空航天大學,由徐邁擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於知識域與數據域協同的圖像壓縮算法研究
  • 依託單位:北京航空航天大學
  • 項目負責人:徐邁
  • 項目類別:青年科學基金項目
項目摘要,結題摘要,

項目摘要

近年來,隨著蘋果等智慧型手機的發展以及無處不在的微博、線上視頻等各類新型網路業務的普及,無線通信需傳輸的多媒體數據量變得日益龐大。因此,圖像/視頻壓縮在無線多媒體通信中日趨重要。傳統圖像壓縮算法大多基於數據域,通過預定義的正交基變換實現,占大量存儲空間,不利於圖像/視頻高效傳輸。另一種新的研究思路為:在知識域上,即利用事物歸納後的知識集合,通過圖像理解標識圖像中物體的類別,進而套用於圖像壓縮,從而大幅提高圖像壓縮效率;該研究在國際上尚處於起步階段。本項目將利用已有研究基礎,以提高圖像壓縮率為目標,研究內容為:(1)借鑑人類邏輯思維與圖像認知機理,在知識域上研究統計學習與邏輯法則學習相結合的圖像理解算法;(2)在數據域上研究各類物體紋理字典的機器學習算法及其稀疏表示的計算模型;(3)融合數學模型與圖像認知,構建數據域與知識域協同的圖像壓縮體系框架。本項目將為圖像壓縮提供新的理論依據與技術支持。

結題摘要

本項目從視覺認知的角度出發,在知識域上結合圖像的結構知識與認知規律,在數據域上深入研究了圖像及視頻壓縮方法,並著重研究了低碼率下的圖像壓縮算法。在知識域上,本項目研究了圖像的認知模型,為圖像壓縮奠定基礎;在數據域上,結合知識域的認知模型,本項目研究了圖像及視頻壓縮的具體方法。本項目已完成的研究內容如下:(1)利用統計學習的方法,研究人類視覺認知機理,並在此基礎上提出了一系列圖像識別及顯著性檢測方法,有效地提升了現有圖像/視頻顯著性檢測的精度,在知識域上為圖像/視頻壓縮構建了視覺認知模型。代表性論文發表在ICCV、CVIU等計算機視覺領域頂級會議與期刊上。(2)在視覺認知模型基礎上,結合圖像/視頻的顯著性信息,本項目提出了碼率、複雜度等編碼資源的最佳化方法,並在下一代視頻編碼標準HEVC基礎上,進一步地提升了圖像及視頻的率-失真性能,在感知失真不變的前提下,大幅地節省了圖像/視頻的壓縮碼率。代表性論文發表在IEEE JSTSP、TCSVT、ICME、DCC等信號處理領域及視頻壓縮領域的頂級期刊與會議上。(3)面向低碼率的圖像壓縮,本項目提出了梯度下降的紋理字典學習方法,旨在從已有的訓練圖像中歸納自然圖像所蘊含(符合人類視覺認知)紋理的基本規律:基本紋理元,即組成自然圖像的基本紋理樣式。進一步,提出了可壓縮的稀疏表示的計算模型,對稀疏表示係數進行量化與熵編碼後,將其套用於圖像低碼率壓縮中,大幅地提升了低碼率下(如0.1bpp)圖像的壓縮質量。代表性論文發表在IEEE TCSVT、VCIP等視頻編碼領域頂級期刊與權威會議上。此外,本項目構建了圖像壓縮平台,有效地驗證了相關圖像壓縮算法的性能,部分代碼已完成開源。綜上,本項目為從視覺認知角度研究圖像/視頻壓縮提供了新的理論依據與技術支撐。 圍繞上述研究內容,本項目共發表學術論文25篇,其中包括IEEE Transactions等國際頂級期刊SCI論文8篇,ICCV等國際知名會議EI論文17篇;獲授權專利2項,正在申請專利3項;超額完成了預期研究成果。此外,多次獲得IEEE國際會議/期刊最佳論文獎及提名。項目負責人2013年入選北京航空航天大學“卓越百人”青年人才引進計畫,2014年入選微軟亞洲研究院“青年教師鑄星”計畫,並獲2015年ICCV青年學者資助獎。

相關詞條

熱門詞條

聯絡我們