基於機率圖模型的張量分析及套用

項目摘要

現有的張量分析方法基本上都圍繞著重建誤差最小化和類間可分離量最大化的思路進行，而本項目則在機率圖模型下研究張量分析，是研究張量分析的新方向。本項研究將不僅揭示張量分析的機率本質(機率解釋)，更為重要的是能夠藉助體系完備的機率論定理和圖模型，使張量分析的理論更加完善，能夠對基於張量數據的實際系統建立強有力的機率圖模型，使張量分析在處理諸如最最佳化方法、收斂性、線上學習等問題上有更先進、更靈活的解決方法。傳統的機率圖模型基本上都是基於向量數據的，對於小樣本訓練集容易過擬合，而基於張量的機率圖模型則可以克服或緩解這一難題。傳統的張量分析主要用來特徵提取，而本項目的張量分析有明顯的機率意義，還可直接用於物體分類、數據摘要化和檢索、物體合成等。本項目的主要研究內容是建立張量數據和多層貝葉斯模型之間的聯繫，研究張量多層貝葉斯模型的最最佳化問題以及相關的套用。

結題摘要

在張量分析、機率圖模型等方面發表22篇，其中SCI論文14篇。申請2項國家發明專利。(1) 對於諸如影評-用戶等推薦系統中的數據，我們提出把這類數據增加一個時間維數，構成三階張量數據，作為協同濾波的輸入。進而提出了基於三階張量的機率張量分析方法，引入了時間信息以及周期信息作為約束條件。在目標函式中採用了Tsallis divergence，使得算法對噪聲的魯棒性得到了顯著提高。算法的最優解由q-EM算法疊代求解。(2) 已有張量分析大都基於Frobenius範數，而該範數受離群樣本的影響很嚴重。為了克服這一問題，提出了基於L1範數的魯棒張量分析方法。該方法對於張量數據，用L1範數表達了各個模態下的基向量構成的目標函式，通過在多模態上交替疊代求得最優解。對算法的收斂性進行了嚴格證明。(3) 為了充分挖掘圖像和文本的信息，建立兩者之間的語義联系，提出了兩層機率主題模型。該模型由文本層機率主題模型和圖像層機率主題模型組成。文本層機率主題模型能夠從大量文本中抽取有用主題，有效抑制文本的噪聲；圖像層機率主題模型，得到了圖像的視覺相似度和語義相關性信息，這些信息可以有效補充文本語義。該算法已成功套用於遊記文本配圖系統中。(4) 提出了能夠挖掘局部主題和全局主題的機率主題模型。把Document-term的機率分布表示成局部主題和全局主題的機率組合。其中局部主題與文本的位置主題相關聯，表達了某位置的獨特主題特性。全局主題則包含了該類文檔的總體特性。用多層機率圖刻畫各變數之間的機率依賴關係。為了突出局部主題，提出用互信息量衡量局部主題和數據集合的相關性。在最最佳化上，使用廣義期望最大化算法，通過E-Step和M-Step疊代進行參數求解。(5) 提出了三階張量和三角形約束(三對約束)的尺度不變的圖像匹配方法。傳統譜分解方法僅僅利用了成對約束(pairwise constraint),當兩幅圖像的尺度差別較大時，該約束失效。為了克服這一問題，提出三對約束進行圖像匹配的方法，利用相似三角形的原理，使用一個三階張量來表示候選配對點的affinity matrix。還提出了加權投票機制，使得圖像匹配既具備尺度不變性，還有很高的匹配效率。(6) 提出了一種基於高斯分布的增量式閾值分類器。用增量式的方法來對特徵的機率分布進行建模，利用Chernoff界來近似訓練誤差，並解析解來得到最優閾值。

基於機率圖模型的張量分析及套用

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條