《多維數字媒體的稀疏表示、結構化處理與聯合編碼》是依託上海交通大學,由熊紅凱擔任項目負責人的聯合基金項目。
基本介紹
- 中文名:多維數字媒體的稀疏表示、結構化處理與聯合編碼
- 項目類別:聯合基金項目
- 項目負責人:熊紅凱
- 依託單位:上海交通大學
項目摘要,結題摘要,
項目摘要
隨著數字媒體向多維空間和高解析度空間發展,表現形式呈現在視間-時間-空間的高階冗餘、在多維結構的奇異性、在相關信號集合上的聯合稀疏性。本申請面向當前多視信源空間的內容互動服務,通過理論和實驗的學習與泛函最佳化,建立字典和採樣的映射,利用多視信源的稀疏性、低秩性、相關性,最佳化數據表示和信號分析、編碼的耦合性,實現基於子空間分析的稀疏表示、基於聯合參數化多尺度字典的線上學習,基於結構推演的信號分析、基於多矢量觀測的聯合編碼和矩陣重構,逼近理論性能。把處理低維信號的現有理論,推廣到多維信號領域,運用流形規劃和多視圖幾何等方法,構造稀疏的多維視覺信息統計模型,建立多維可視化信息獲取和處理的智慧型計算理論框架,服務於數字家庭網路和立體視頻的媒體套用,以應對普遍存在的大尺度、高數據量、高複雜度的挑戰。
結題摘要
本面上項目“多維數字媒體的稀疏表示、結構化處理與聯合編碼 (U1201255)”,4年共發表重要學術論文111篇,其中:SCI期刊論文34篇,IEEE Trans彙刊22篇,13篇頂級國際會議論文,38篇著名國際會議論文,34項授權國家發明專利,申請49項;參加了27次國際學術會議,作16次專題演講報告;2016年8月,成功主辦國內重要學術會議HHME’2016;共培養博士後2名,博士6名,碩士35名;人才隊伍建設培養了:國家傑出青年科學基金1人(2014)、教育部長江學者特聘教授1人(2016)、科技部中青年創新領軍人才(2016)、上海市優秀學術帶頭人(2016)、上海市曙光學者(2013)、上海市青年科技英才(2014);3次國際會議最佳論文獎:2015年、2014年IEEE VCIP最佳學生論文獎、2013年IEEE BMSB最佳論文獎;獲國家科技進步二等獎一次(排名第4),廣東省科技一等獎; (1)多維視覺媒體的稀疏表示 基於數據驅動子空間集模型進行視頻壓縮採樣,利用線性子空間學習確定各個子空間的最優拓撲結構;利用結構化稀疏性的先驗知識作約束,進行正則化學習,提升稀疏表示性能。同時鬆弛傳統上下文約束條件,在多維方向上構造廣義上下文模型樹。 (2)多維視覺媒體的字典學習 提出空時一致性線上字典學習算法,根據視頻採樣信號的真實分布最佳化期望代價函式,形成最佳化的三維時空字典;提出基於漸進學習的可伸縮視頻編碼,引入可分級B幀,建立分層預測結構,利用已重構層線上學習,漸進更新字典,保持空時一致性,逐層進行高效率重構。 (3)多維視覺特徵的結構化建模 提出基於結構核函式和多尺度部件模型的物體識別算法與基於樹結構模型的直推式視頻分割算法,利用時間一致性約束的時域樹聚類,進行直推式學習;提出基於多任務語義碼本學習和上下文感知表示的場景分類方法,進而學習文本、物體和場景之間跨域關係,以條件隨機場描述文本、物體和場景的聯合機率。 (4)多維視覺信源的編碼傳輸和重構 提出結構化傳輸最佳化的效用模型,擴展傳統率失真最佳化模型,進一步提出端到端的延遲-率-失真模型,考慮了整個端到端延遲在不同延遲分量之間的分配。 上述成果系統描述了多維數字媒體的稀疏表示、字典學習、視覺特徵的結構化建模以及多維視覺信源的稀疏編碼和條件重構,為廣泛化和普適化的多維數字媒體提供了理論基礎和套用實例。