基於社會標記精化的多標記學習算法研究

基於社會標記精化的多標記學習算法研究

《基於社會標記精化的多標記學習算法研究》是依託同濟大學,由衛志華擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於社會標記精化的多標記學習算法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:衛志華
  • 依託單位:同濟大學
中文摘要,結題摘要,

中文摘要

不同於傳統的單標記學習問題,多標記學習考慮一個對象對應多個類別標記的情況,是當前國際機器學習領域研究的熱點問題之一。然而,由於多標記學習中標記組合的多樣性,其學習的準確率尚待提高,並且訓練樣本獲取困難問題已成為制約該領域研究的瓶頸。本項目以網際網路視頻自動標註為背景,研究以下問題:(1)針對社會標記的模糊性、個性化等問題,擬通過內容感知與語義計算相結合的方法,對社會標記進行去噪、修正、推薦、合併,實現社會標記精化;(2)針對標記關係不確定性的問題,擬通過貝葉斯網路對標記關係建模,實現標記關係的量化描述;(3)針對多標記學習中常忽略標記依賴關係的問題,擬通過最最佳化理論訓練標記關係對多標記集成學習的約束參數,達到提高多標記分類性能的目的。不同於傳統的直推式學習方法,採取將樣本精化和多標記學習兩個複雜問題分而治之的思路,豐富和拓展了機器學習理論和方法,對於解決網際網路視頻標註問題具有重要的指導意義。

結題摘要

本項目針對多標記學習中標記組合多樣性帶來的諸多不確定性問題,以圖像多標記分類為主要研究對象,圍繞以下幾方面進行了深入的研究: (1) 針對多標記分類中樣本標記較難獲取、訓練集擴展困難的問題,我們研究了半監督多標記分類算法,提出了基於最近鄰編輯的半監督多標記學習算法。 (2) 針對樣本社會標記不確定的問題,研究了社會標記精化算法。運用圖像相似度和圖像相關的文本相似度來精化社會標記,包括去除不正確標記、增加規範化標記等。基於排序思想研究多標記文檔分類算法,從標記之間序的關係入手提升分類準確率。 (3) 針對多標記分類算法本身,研究針對不同問題的分類模型。不同的數據集往往存在不同的內部關係,這就需要根據實際情況進行分析和設計相應算法。 (4) 面向具體套用,研究監控視頻序列中人、車等對象的自動標註算法。對於多標記圖像分類的實際套用,我們主要在監控視頻序列中人、車等對象的標註方面展開研究。目前,已經較好地解決了視頻序列中單個對象的標註問題,下一步將解決多目標標註問題。 (5) 建立了多標記圖像數據集。一方面,我們基於web蒐集了大量圖片,建立了層次結構的圖像數據集,包括10個大類,81個小類,超過2500張來自真實世界的圖片。另一方面,我們採集了車載行人檢測和車道檢測實驗所需的視頻資源,按照不同場景對視頻進行了劃分。這些資源為我們開展研究工作做了良好的儲備。 另外,課題組在監控視頻中人、車、物等檢測和跟蹤方面也開展了大量的研究工作,為後續視頻內容理解和自然語言描述的進一步研究奠定了良好的基礎。

相關詞條

熱門詞條

聯絡我們