面向套用環境的高效三維視頻編碼最佳化算法研究

中文摘要

三維視頻(Three-Dimensional Video, 3DV)可以讓用戶體驗到“身臨其境”的立體視覺感知，數十年來一直是人類追求的視覺體驗目標。為了與已有視頻編碼框架兼容，3DV通常採用多視點視頻(Multi-View Video, MVV)或多視點視頻-深度(Multi-view Video plus Depth, MVD)來表示。由於MVV和MVD的數據量依然十分巨大，在頻寬和存儲容量有限的條件下，高效的壓縮編碼和編碼最佳化算法是促進3DV大規模套用的關鍵技術。本項目將在前期研究的基礎上，考慮3DV的套用環境，即移動套用環境和高保真套用環境，並結合不同套用環境下人眼的主觀視覺感知的差異，分別設計3DV的編碼最佳化算法。本項目將為3DV的大規模套用提供新的理論依據與實現方法，並將為下一代3DV編碼標準做足技術儲備。

結題摘要

在本項目的資助下，項目組順利開展了申請書中的相關研究內容。對於高保真視頻套用場景，我們以MSE作為失真準則，首先深入研究了虛擬視圖的失真分布特徵，提出了一種快速準確地虛擬視圖質量PSNR估計方法、保障虛擬視圖質量的深度圖率失真最佳化編碼及碼率控制方法；研究了多視點視頻之間的依賴關係，提出了面向多視點視頻總體質量的編碼最佳化方法。對於移動端視頻套用場景，我們研究了基於DASH協定的流媒體傳輸方法，考慮了用戶的視覺感知特徵以及系統內用戶的公平性要求，提出了新的用戶體驗質量模型，並據此設計了基於合作博弈與非合作博弈的傳輸控制策略；為應對複雜的網路波動，我們還提出了基於集成學習的碼率自適應方法，以及視頻內容的空間-時間一致性保持算法。此外，在基於混合失真測度的編碼方面，我們綜合考慮了MSE失真測度和SSIM失真測度，即在保障用戶主觀質量的條件下，使得MSE失真也最小，提出了相應的率失真最佳化編碼方法以及虛擬視圖質量增強方法。除此之外，課題組也將項目研究內容進行深入拓展，研究了下一代3D視頻，即三維點雲的高效壓縮算法。研究期間總計發表論文34篇（28篇期刊，6篇會議），其中項目負責人以第一作者身份，在IEEE Transaction上發表論文10篇(1篇IEEE JSTSP，1篇IEEE TMC，1篇IEEE T CSVT，3篇IEEE T MM，4篇 IEEE T BC)，獲得發明專利授權4項，為三維視頻的大規模套用做出了一定貢獻。

面向套用環境的高效三維視頻編碼最佳化算法研究

基本介紹

中文摘要

結題摘要

相關詞條

熱門詞條