《基於多示例學習的多模態信息表達與推薦方法研究》是依託武漢理工大學,由袁漢寧擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於多示例學習的多模態信息表達與推薦方法研究
- 項目類別:青年科學基金項目
- 項目負責人:袁漢寧
- 依託單位:武漢理工大學
項目摘要,結題摘要,
項目摘要
網際網路中存在多種模態的媒體對象,單一模態的信息表達限制了用戶獲取信息的有效性和準確性。多示例學習適合解決多模態信息的表達問題,但其現有的方法不能處理多模態信息。本項目研究基於多示例學習的多模態信息表達和推薦方法:.(1)研究多模態信息的多示例表達機制,構建異質多模態信息表達模型和同質多模態信息的表達模型,以全面準確地表達多模態信息;.(2)研究多模態信息的多示例學習算法,設計基於示例選擇的啟發式異質多示例SVM分類算法,以及基於多模態信息統一化方法的同質多示例學習算法,實現多模態信息的比較和計算;.(3)研究多模態信息的多示例推薦算法,實現包層次粗粒度的推薦和示例層次細粒度推薦;設計用戶興趣更新算法及時跟蹤用戶興趣,用雲模型可視化用戶興趣。. 本項目最後研製原型系統驗證方法的有效性和可靠性,成果將為用戶全面準確地獲取信息資源提供理論和方法支持,具有潛在的套用價值。
結題摘要
現有的信息表達和推薦方法是針對單一模態信息的,限制了用戶獲取信息資源的準確性和有效性。鑒於多示例學習獨特的性質適合解決多模態信息的表達和推薦問題,本項目研究了基於多示例的多模態信息表達和推薦方法,具體內容包括 (1)構建多模態信息的表達模型。基於多示例學習,面向網頁多模態信息推薦,構建了基於多示例的多模態網頁信息表達模型;面向手寫體識別,構建了包含不同特徵空間的基於異質多示例的多模態手寫體表達模型;面向電影推薦,構建了包含項目內容特徵的多模態電影信息表達模型。 (2)設計和實現多示例學習算法。在多示例學習領域,在實現包內示例的重抽樣方法的基礎上提出了一種雙層多示例集成學習框架,有效提高了多示例學習精度。在異質多示例學習領域,設計和實現了基於SVM的異質多示例學習方法,包括基於SVM的異質多示例學習的框架和基於SVM的啟發式異質多示例學習算法,實現了多模態信息的計算。 (3)設計和實現多示例推薦算法。基於多模態電影信息表達模型,根據多示例學習模式具有一定容錯性的特點,設計和實現了了基於多示例聚類的協同推薦算法,通過多示例聚類計算用戶的最近鄰集合,根據最近鄰集合對用戶評分進行預測。該算法不僅提高了推薦結果的準確性也有效地緩解了數據稀疏性問題。 (4)基於多示例的套用。在多示例算法研究的基礎上,將算法成功套用於財務風險識別、手寫體數字識別和電影推薦領域。 通過上述研究構建基於多示例學習的多模態信息表達和推薦的理論與方法體系,達到了項目的預期目標。在項目基金的支持下,項目成員在國內外核心期刊上發表高質量的學術論文11篇,其中SCI收錄 7篇,EI收錄3篇。參加國際學術會議交流2次,編寫十二五工信部規劃教材1本,獲得軟體著作權1 項,獲湖北省科技進步一等獎,聯合培養博士生1名,碩士生4名。