基於稀疏表達的圖像語義理解機制研究

基於稀疏表達的圖像語義理解機制研究

《基於稀疏表達的圖像語義理解機制研究》是依託浙江大學,由吳飛擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於稀疏表達的圖像語義理解機制研究
  • 依託單位:浙江大學
  • 項目負責人:吳飛
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

本課題將結合統計分析、機器學習和計算機視覺等交叉領域最新進展和熱點研究,建立基於稀疏表達的圖像語義理解框架,主要內容包括:圖像高維異構特徵稀疏性組效應選擇、關聯共生圖像語義的共享結構學習、非標記樣本利用、結合特徵選擇一致性模型和複雜度平滑計算手段的算法實際性能分析方法。通過有機集成相關研究成果與技術,面向公共開放圖像數據集和網際網路圖像研發圖像語義理解原型系統,對相關算法進行對比、驗證和完善。

結題摘要

從圖像數據中所提取特徵具有高維異構特性,若干特徵組合在一起可用來構建具有關聯共生關係圖像語義之間的共享結構,如何針對圖像語義理解過程中高維異構特徵所具有的這一特點,利用壓縮感知和變數選擇等基本理論和方法,研究結構性正則化因子和多任務學習等機制,實現高維異構特徵稀疏性結構選擇和圖像語義共享結構學習,是提高圖像語義理解性能面臨的重要挑戰。 項目按照計畫書所列內容順利開展,重點圍繞從圖像高維異構特徵中選擇最具區別性特徵,建立起解釋性(interpretable)更強的模型來理解圖像中豐富語義這一核心問題而展開。項目研究的重點是如何充分利用高維特徵中存在的結構先驗知識(structural priors),實現結構稀疏正則化因子(Structured sparsity-inducing norms)來加強特徵選擇以及如何保證選擇結果的一致性(consistency)。 基於這樣的考慮,項目對如下內容進行了深入研究:高維特徵稀疏性組效應選擇、關聯共生圖像語義的共享結構學習、非標記樣本利用以及特徵選擇中一致性模型。項目研究期間,提出了結構性輸入/輸出正則化因子、基於圖的共享特徵學習、基於稀疏組效應和多核學習的特徵選擇、結構稀疏譜哈希、基於最大間隔學習的張量分解、非凸組稀疏一致性選擇模型等算法和具體方法。 研究期間,項目組一共發表論文20篇,其中包括本領域頂級和權威學術期刊IEEE Transactions on Image Processing(1篇)、IEEE Transactions on Circuits and Systems for Video Technology (1篇)、IEEE Transactions on Multimedia (1篇)、ACM Multimedia(4篇,其中Full Paper 3篇)、AAAI(oral paper 2篇)、SIGIR (Full Paper 1篇)。項目研究期間獲得第六屆和諧人機環境聯合學術會議最佳論文(2012年度)。 項目研究期間,參與研究的博士生韓亞洪獲得2012年度中國計算機學會優秀博士論文(博士論文題目“基於圖模型表達和稀疏特徵選擇的圖像語義理解”, 導師為莊越挺教授)。項目負責人吳飛入選教育部新世紀優秀人才支持計畫(2011年度)。

相關詞條

熱門詞條

聯絡我們