基於主動學習和遷移學習的協同過濾算法研究

基於主動學習和遷移學習的協同過濾算法研究

《基於主動學習和遷移學習的協同過濾算法研究》是依託中山大學,由潘嶸擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於主動學習和遷移學習的協同過濾算法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:潘嶸
  • 依託單位:中山大學
中文摘要,結題摘要,

中文摘要

隨著網際網路的發展,推薦系統在眾多領域中有著廣泛的套用。協同過濾是目前工業界和學術界的主流方法。它利用的數據是系統中收集的用戶的偏好數據,例如:用戶喜歡看哪些電影。協同過濾算法假設用戶的偏好隨時間遷移變化不大,從而利用用戶過去的偏好數據,預測用戶未來可能的行為。由於各種不同原因,用戶偏好數據收集比較困難,數據稀疏性(極端的情形是新用戶/新對象問題;大多數問題的稀疏性大於99%)是協同過濾算法遇到的主要問題。近年來,主動學習以及利用跨領域數據的遷移學習是研究人員在一些問題中解決數據稀疏問題的兩種有效工具。它們的基本思想是分別在本領域和附加的其它領域中高效的挖掘有用信息,改進原來領域學習任務的效果。在本研究中,我們沿著這兩個不同的思路,並利用兩種思路的互補,考慮如何利用跨領域數據,設計一種主動收集、分析能夠反映用戶喜好信息的模組,以解決協同過濾中的數據稀疏問題,進而提高協同過濾算法預測的準確性。

結題摘要

隨著網際網路的發展,推薦系統在眾多領域中有著廣泛的套用。協同過濾是目前工業界和學術界的主流方法。它利用的數據是系統中收集的用戶的偏好數據,例如:用戶喜歡看哪些電影。協同過濾算法假設用戶的偏好隨時間遷移變化不大,從而利用用戶過去的偏好數據,預測用戶未來可能的行為。由於各種不同原因,用戶偏好數據收集比較困難,數據稀疏性(極端的情形是新用戶/新對象問題;大多數問題的稀疏性大於99%)是協同過濾算法遇到的主要問題。近年來,主動學習以及利用跨領域數據的遷移學習是研究人員在一些問題中解決數據稀疏問題的兩種有效工具。它們的基本思想是分別在本領域和附加的其它領域中高效的挖掘有用信息,改進原來領域學習任務的效果。在本研究中,我們沿著這兩個不同的思路,並利用兩種思路的互補,考慮如何利用跨領域數據,設計一種主動收集、分析能夠反映用戶喜好信息的模組,以解決協同過濾中的數據稀疏問題,進而提高協同過濾算法預測的準確性。依託本項目,共發表12篇學術論文,其中包括2篇IJCAI,1篇ICDM;培養了5名碩士研究生,另有一名博士研究生和多名碩士研究生在讀。

相關詞條

熱門詞條

聯絡我們