《基於演化學習的名人識別技術與名人庫構建研究》是依託北京理工大學,由高廣宇擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於演化學習的名人識別技術與名人庫構建研究
- 依託單位:北京理工大學
- 項目負責人:高廣宇
- 項目類別:青年科學基金項目
項目摘要,結題摘要,
項目摘要
目前,多媒體數據隨著信息傳播速度加快而急劇增加。在這些數據中,體現人們共同關注焦點的名人(影視明星、政治人物等)數據具有很重要的價值。本研究正是針對名人圖片視頻識別和分析挖掘,旨在提出一種新的基於稀疏表示和條件隨機場的人物識別算法以及模擬嬰兒學習過程的半監督演化學習模型。同時,針對訓練樣本有限問題,利用視頻上下文信息來解決,並構建海量名人資料庫。簡而言之,通過模仿嬰兒成長的學習過程,在嬰兒成長初期,首先給定有限靜態圖片,建立初始弱分類模型。然後,基於該模型將數據集中獲得較確定判別的數據加入到知識庫(訓練庫)中。最後,結合新加入樣本,重新演化獲得新模型至收斂。具體而言,本研究首先研究如何利用有限樣本和多模態稀疏表示方法及隨機場理論來構建高效人臉識別算法。其次,利用上下文信息,提出一種新的學習模型(演化學習模型)。最後,利用上述模型,自動採集大量圖片視頻構建基於HBase的海量名人資料庫。
結題摘要
目前,多媒體數據隨著信息傳播速度加快而急劇增加。在這些數據中,體現人們共同關注焦點的名人(影視明星、政治人物等)數據具有很重要的價值。本項目針對名人圖片視頻數據識別、名人資料庫構建以及相關的套用開發問題,提出了一系列的算法、模型和套用。經過項目組全體成員的共同努力,圓滿實現了預定計畫。具體而言,通過本項目的建設,實現並完成了以下內容: 1、提出了一種新的基於稀疏表示和條件隨機場的人臉識別方法,以及模擬嬰兒學習過程的半監督演化學習模型。本研究首先主要研究如何從通用性考慮,利用上下文信息,提出一種新的模式識別學習方式和模型。其次,就具體套用而言,研究如何利用多模態特徵,使用多模態稀疏表示方法和隨機場理論來構建高效人臉識別模型。與此同時,除了考慮視覺特徵外,還考慮音頻特徵,提出了利用音頻特徵基於核的多任務聯合稀疏表示的人物識別方法。2、為了更好地解決標記數據稀少的問題,引入半監督學習思想。利用視頻上下文信息,解決了名人識別和檢索,用於在多媒體特徵學習和異構數據關聯挖掘方面進行了深入的研究。此外,構建了海量名人資料庫,利用Spark大數據分析架構,對海量數據集進行處理,提出了新的高效名人識別方案。 3、面向多媒體環境下數據噪聲、異構、關聯等特點,結合多媒體計算和深度學習相關算法,提出了結合深度學習和傳統機器學習算法的多種多媒體學習算法,包括,跟名人識別相關的,如顯著區域預測、多媒體字幕識別、基於人物的服裝搭配推薦等多媒體分析算法和相關套用。上述研究內容最終以論文、專注等多種形式呈現,包括:出版英文專著1部,發表包括IEEE Trans.期刊論文在內的中科院JCR分區二區和三區論文4篇,國際會議論文6篇,申請中國國家發明專利3項,培養本科生研究生若干等。