基於隱因子模型的統計關係學習

基於隱因子模型的統計關係學習

《基於隱因子模型的統計關係學習》是依託上海交通大學,由李武軍擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於隱因子模型的統計關係學習
  • 項目類別:青年科學基金項目
  • 項目負責人:李武軍
  • 依託單位:上海交通大學
項目摘要,結題摘要,

項目摘要

機器學習已經發展成為人工智慧領域的一個研究熱點,被廣泛地套用於人工智慧的各個子領域,例如數據挖掘、模式識別等。傳統機器學習模型假設數據是獨立同分布的。然而,在很多實際套用中,數據樣本之間是有關係的,也就是說,樣本之間是不獨立的。例如,網頁之間存在著連結關係,社交網路中的對象之間存在各種各樣的關係。我們把這種樣本之間存在關係的數據叫做關係數據,把基於關係數據的機器學習叫做統計關係學習。由於關係數據在不同領域不斷湧現,統計關係學習已經成為一個具有重要科學意義和套用價值的研究課題。目前主流的統計關係學習模型都是靜態、集中式的,不適合於對動態的海量關係數據進行處理。本項目以動態海量關係數據的智慧型分析為研究對象,採用隱因子模型作為基本建模工具,構建動態統計關係學習模型,設計高效的參數存儲模式,實現基於雲計算的超大規模分散式參數學習算法,建立一套完整的具有理論創新和實際套用的統計關係學習工具包。

結題摘要

本項目以動態海量關係數據的智慧型分析為研究對象,探索基於隱因子模型(LFMs)的統計關係學習的建模、大規模存儲和計算、以及套用驗證問題。本項目的實施嚴格按照項目申請書和計畫書進行,項目組已圓滿完成計畫規定的研究內容,達成了預期目標。在本項目的資助下,項目組共發表(錄用)論文15篇,其中中國計算機學會(CCF)推薦A類會議和期刊論文11篇,B類會議3篇;申請專利4項;出版雲計算專著一部;構建了一套統計關係學習工具包。項目組在動態關係模型設計和參數學習的超大規模實現兩個方面取得了若干研究成果。在動態關係模型設計方面,項目組以動態社交網路為研究對象,提出了一種以結點為中心的線上學習算法OEM,成果發表於IJCAI 2013。在參數學習的超大規模實現方面,項目組從存儲和計算兩方面入手,設計了一系列數據(參數)壓縮和分散式數據(參數)布局策略,並提出了一系列分散式計算(學習)機制,代表性成果發表於ICML 2014, SIGIR 2014, NIPS 2014等。此外,項目組還對多關係異構網路等若干相關研究領域進行了探索,代表性成果發表於AAAI 2012、IJCAI 2013和IEEE Transactions on Knowledge and Data Engineering等。部分研究成果在淘寶等的企業級真實套用上進行了實驗驗證,取得了比現在工業界廣泛採用的方法更好的性能。本項目研究的分散式學習是大數據機器學習的核心研究內容之一。因此,在此項目成果的基礎上,項目組將進一步在大數據機器學習上進行探索。

相關詞條

熱門詞條

聯絡我們