基於區分型碼本的圖像表示的研究與套用

基於區分型碼本的圖像表示的研究與套用

《基於區分型碼本的圖像表示的研究與套用》是依託華中科技大學,由王興剛擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於區分型碼本的圖像表示的研究與套用
  • 項目類別:青年科學基金項目
  • 項目負責人:王興剛
  • 依託單位:華中科技大學
中文摘要,結題摘要,

中文摘要

基於特徵集的圖像表示是計算機視覺中十分核心且具有挑戰性的問題,在諸多套用中發揮著重要作用。本項目擬提出一種新穎的基於區分型碼本的圖像表示方法,它具有三個主要優點:(1)採用了一種新的數據空間劃分方式,使得圖像表示更加簡潔;(2)區分型碼本自動學習樣本各維度的權重,可以有效融合不同種類的特徵;(3)能夠在碼本中融入人工標註的高層語義,使得圖像表示更加高效。本課題研究焦點在於區分型碼本的性質、學習方法、編碼方法、圖像表示、以及解決大規模數據下的圖像分類、物體檢測等套用問題。本課題中的研究有助於解決區分型聚類、弱監督學習、物體識別等機器學習、計算機視覺領域中的任務。另外,區分型碼本是一種通用的碼本表示方法,可以套用於文本、音頻等多媒體數據的表示,並推動相關領域的研究發展。

結題摘要

圖像的表示是計算機視覺中的核心問題,本項目中以區分型碼本為中心來研究新型的圖像表示方法,在基於深度學習的區分型碼本學習、多示例神經網路、弱監督圖像理解三個方面的內容展開了深入的研究。在區分型碼本學習方面,本項目提出了以Deep Patch Learning和FisherNet為代表的方法,在標準測試PASCAL VOC上以較少量的計算取得了業界最好的物體分類性能;其科學意義在於利用局部特徵學習使能小尺度物體分類,以及通過區分式學習構建精簡的圖像表示,從而同時獲得高精高速的圖像分類網路。在多示例神經網路方面,本項目提出了採用深度學習的形式和端到端最佳化的方法來求解多示例學習問題,在幾乎所有的多示例學習標準測試集上都取得了業內最好的性能。其科學意義在於通過深度神經網路來有效求解集合預測問題,揭示了對於多示例具有交換不變性的神經網路的重要性。在弱監督圖像理解方面,本項目提出了一系列優秀的弱監督物體檢測和語義分割方法,例如:OICR、WeakRPN、DSRG、PCL等,是目前效果最好的弱監督圖像理解系統,取得了較大的影響力。其科學意義在於揭示了圖像內在信息分布的平滑性對於弱監督圖像理解的重要性,並利用這種平滑性來讓物體檢測網路和語義分割網路進行自監督學習。相關研究成果可以用於在醫學圖像分析、網際網路圖像搜尋等領域構建大規模的圖像識別系統中套用。

相關詞條

熱門詞條

聯絡我們