面向套用環境的高效三維視頻編碼最佳化算法研究

《面向套用環境的高效三維視頻編碼最佳化算法研究》是依託山東大學,由元輝擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向套用環境的高效三維視頻編碼最佳化算法研究
  • 項目類別:面上項目
  • 項目負責人:元輝
  • 依託單位:山東大學
中文摘要,結題摘要,

中文摘要

三維視頻(Three-Dimensional Video, 3DV)可以讓用戶體驗到“身臨其境”的立體視覺感知,數十年來一直是人類追求的視覺體驗目標。為了與已有視頻編碼框架兼容,3DV通常採用多視點視頻(Multi-View Video, MVV)或多視點視頻-深度(Multi-view Video plus Depth, MVD)來表示。由於MVV和MVD的數據量依然十分巨大,在頻寬和存儲容量有限的條件下,高效的壓縮編碼和編碼最佳化算法是促進3DV大規模套用的關鍵技術。本項目將在前期研究的基礎上,考慮3DV的套用環境,即移動套用環境和高保真套用環境,並結合不同套用環境下人眼的主觀視覺感知的差異,分別設計3DV的編碼最佳化算法。本項目將為3DV的大規模套用提供新的理論依據與實現方法,並將為下一代3DV編碼標準做足技術儲備。

結題摘要

在本項目的資助下,項目組順利開展了申請書中的相關研究內容。對於高保真視頻套用場景,我們以MSE作為失真準則,首先深入研究了虛擬視圖的失真分布特徵,提出了一種快速準確地虛擬視圖質量PSNR估計方法、保障虛擬視圖質量的深度圖率失真最佳化編碼及碼率控制方法;研究了多視點視頻之間的依賴關係,提出了面向多視點視頻總體質量的編碼最佳化方法。對於移動端視頻套用場景,我們研究了基於DASH協定的流媒體傳輸方法,考慮了用戶的視覺感知特徵以及系統內用戶的公平性要求,提出了新的用戶體驗質量模型,並據此設計了基於合作博弈與非合作博弈的傳輸控制策略;為應對複雜的網路波動,我們還提出了基於集成學習的碼率自適應方法,以及視頻內容的空間-時間一致性保持算法。此外,在基於混合失真測度的編碼方面,我們綜合考慮了MSE失真測度和SSIM失真測度,即在保障用戶主觀質量的條件下,使得MSE失真也最小,提出了相應的率失真最佳化編碼方法以及虛擬視圖質量增強方法。除此之外,課題組也將項目研究內容進行深入拓展,研究了下一代3D視頻,即三維點雲的高效壓縮算法。研究期間總計發表論文34篇(28篇期刊,6篇會議),其中項目負責人以第一作者身份,在IEEE Transaction上發表論文10篇(1篇IEEE JSTSP,1篇IEEE TMC,1篇IEEE T CSVT,3篇IEEE T MM,4篇 IEEE T BC),獲得發明專利授權4項,為三維視頻的大規模套用做出了一定貢獻。

相關詞條

熱門詞條

聯絡我們