面向網路弱標記圖像的視覺對象模型線上學習方法

《面向網路弱標記圖像的視覺對象模型線上學習方法》是依託哈爾濱工業大學,由劉揚擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向網路弱標記圖像的視覺對象模型線上學習方法
  • 依託單位:哈爾濱工業大學
  • 項目類別:面上項目
  • 項目負責人:劉揚
項目摘要,結題摘要,

項目摘要

本項目開展面向網路弱標記圖像的視覺對象模型線上學習研究,這一方法可以有效地降低手工標註圖像庫規模小和人為偏好帶來的負面影響。提出馬爾可夫LDA(latent dirichelet allocation)模型,該模型充分考慮了視覺辭彙間的上下文關係,放寬了傳統模型嚴格的獨立性假設要求;針對該模型,採用增量期望最大(IEM)算法,實現線上學習;提出基於加權的樣本採樣策略,降低模型的訓練規模;研究馬爾可夫LDA模型下的計算學習理論,並指導設計數據編輯操作策略,從而得到可靠的增量訓練集合,避免模型線上學習過程中出現概念漂移問題。最後,通過在圖像檢索系統中套用,驗證方法的有效性。本項目對研究視覺對象新模型、發展網路圖像檢索方法以及促進圖像理解與機器學習的結合都具有重要的意義。

結題摘要

本項目開展面向網路弱標記圖像的視覺對象模型線上學習研究,該項研究主要目標為設計一個適當的視覺對象模型,並能夠在弱標記環境下對模型參數實現線上學習算法。具體開展了如下一些關鍵技術研究:研究網路環境下大規模圖像數據的套用,該研究途徑可以有效地降低手工標註圖像庫規模小和人為偏好帶來的負面影響;研究馬爾可夫 LDA(latent dirichelet allocation)模型,該模型充分考慮了視覺辭彙間的上下文關係,放寬了傳統模型嚴格的獨立性假設要求;結合深度學習的主題模型;研究針對該模型的線上訓練算法,及並行參數估計;研究基於加權的樣本採樣策略,降低模型的訓練規模,同時研究面向大數據的並行採樣估計算法;研究基於稀疏編碼的視覺辭彙構造方法,從而避免手工設計視覺特徵帶來的問題;研究弱標記下的視覺對象分割與檢測技術,擴大了該項研究的套用範圍,並為後續研究提供了新的思路。上述幾種方法在國際上通用的公開測試資料庫(Voc2010,Bsd300,ImageNet)上與當前效果比較好的方法進行了比較,無論是在分類或者分割效果上,還是在運行速度上都取得了更好成績。在完成申請書中所要研究內容外,本項目還加強了與深度學習結合的研究,目前看也取得了比較好的結果。 經過4年的努力,圓滿完成了本項目的任務要求,並在局部有超額,主要體現在基於稀疏編碼的視覺辭彙構造方面。本項目共發表論文22篇,其中國際期刊論文6篇、國內一級學報論文2篇、國際會議論文10篇,翻譯國外教材1部。結合本項目研究工作,培養博士生4人(已畢業2人)、碩士生7人(已畢業4人);申請發明專利1項。

相關詞條

熱門詞條

聯絡我們