《三維表情識別中的張量表示及分解理論和算法研究》是依託北京交通大學,由阮秋琦擔任項目負責人的面上項目。
基本介紹
- 中文名:三維表情識別中的張量表示及分解理論和算法研究
- 項目類別:面上項目
- 項目負責人:阮秋琦
- 依託單位:北京交通大學
項目摘要,結題摘要,
項目摘要
表情識別是人機互動的關鍵技術,它在計算機視覺、行為科學、情感計算、監控系統、社會安全、輿情分析及遊戲娛樂等領域中有重要的理論意義和套用價值。但是,人臉是一個塑性變形體,表情建模難度大,在統一性特徵提取、表情描述精細度及識別率方面仍存在很多亟待解決的問題。基於張量代數的方法有可能避免維數災難和小樣本等問題,並且可有效去除張量數據的冗餘。基於張量子空間的建模與分解對揭示人臉表情流形以及增強表情類別間的鑑別性有較大優勢。但是目前基於張量表征的表情識別尚不深入。本課題將研究以下關鍵問題: ①探討三維人臉表情的張量子空間建模及正交張量流形學習算法,同時給出理論解釋;②研究張量分解和流形學習相結合的張量-張量映射的降維算法,探討三維人臉表情識別中的理論依據;③非負張量分解(NTF)與圖保持的流形學習準則結合,探討非負基圖像的稀疏性表示;④搭建基於張量分解和流形學習的三維人臉表情識別驗證系統。
結題摘要
表情識別是自然人機互動的核心內容,在面向國家公共安全領域的社會感知數據處理的理論方法和關鍵技術中,人臉表情識別和分析也扮演著重要角色,同時,表情識別在生理學及心理學、行為科學、情感計算等基礎科學研究方面也有重要的指導意義。表情也是重要的生物特徵之一,表情識別在信息安全中也有重要套用價值。因此,它在安全保密、輔助醫療等其它需要解釋面部表情的領域和行業中也會有廣泛的套用。 該項目(1)從嚴密的張量代數理論出發,利用張量子空間的基、張量子空間投影、張量子空間重構的定義,抽象出一個統一的張量子空間模型;(2)在張量表示的基礎上尋找更有效的投影基,以獲取人臉表情的有效表征;(3)張量-張量映射、張量秩一分解、非負張量分解與基於圖保持的流形學習相結合的理論可行性論證等都是本項目的關鍵科學問題; 本項目在上述關鍵問題研究的基礎上,提出了統一的張量子空間模型,探討了張量降維問題;提出了正交張量鄰域保持嵌入算法(OTNPE)、張量秩一差分圖保持分析算法(TR1DGPA)、鑑別的鄰域保持非負張量分解算法(DNPNTF)、基於低秩圖的稀疏鑑別保持投影算法(LRG-SDPP)、稀疏正則化鑑別局部保持投影算法(SRDLPP)、疊代加權求解lp範數最小化問題的算法、低秩張量分解的2D+3D人臉表情識別方法(FERLrTC)等一系列算法,取得了較好的識別效果。另外,在課題研究階段主辦了四次國際學術會議(IEEE ICSP和IET ICWMMN),並邀請了11位國外相關專家講學和學術交流;培養博士生12名,畢業7名,碩士生16名,畢業12名;發表包括IEEE Trans.在內的論文30篇,獲得發明專利1項。同時培養了青年教師,有兩名教師晉升了副教授。相關技術也套用在了“列車司機防盹睡監測系統的研發”,為實用化進行了嘗試。同時就相關研究為“北京市翱翔計畫”做了三次科普報告,產生了很好的社會效果。