《基於機率圖模型的海量評分數據分析與用戶行為建模》是岳昆為項目負責人,雲南大學為依託單位的面上項目。
基本介紹
- 中文名:基於機率圖模型的海量評分數據分析與用戶行為建模
- 項目類別:面上項目
- 項目負責人:岳昆
- 依託單位:雲南大學
項目摘要,結題摘要,
項目摘要
隨著Web2.0技術的迅速發展,用戶產生的數據急劇增長,電子商務和社會網套用中的用戶評分數據富含了用戶的行為信息,為用戶行為建模的研究提供了依據。海量的用戶評分數據分析和行為建模關鍵技術,是用戶行為分析和預測、也是數據密集型計算在社會數據分析方面亟待解決的問題。本項目從海量的用戶評分數據出發,用隱變數刻畫用戶的行為,以帶隱變數的貝葉斯網(隱變數模型)作為描述用戶行為的理論基礎、不確定性知識表示和推理的基本框架,以MapReduce作為海量數據處理的技術手段,重點研究描述用戶行為的時序隱變數模型構建、分散式存儲、增量修改,以及面向評分預測和異常行為檢測等用戶行為分析典型套用的機率推理查詢處理方法,對新方法進行理論分析和實驗測試,並開發相應的軟體系統。研究成果將為用戶行為數據分析提供有效的支撐技術,為動態演變的用戶行為建模提供新的思路,具有重要的理論意義和套用價值。
結題摘要
通過對項目中關鍵問題的深入研究,取得了基於隱變數模型的評分數據分析和用戶行為建模的階段性研究結果,對照項目申請書和計畫任務書中,已按時完成了預期的目標和任務。在理論方法與支撐技術方面,以機率圖模型作為評分數據中相關屬性之間相互依賴關係及其不確定性表示和推理的基本知識框架,以隱變數表示用戶偏好,針對數據的海量性與分散式、動態性與不確定性等特點,以支持高效準確的用戶偏好建模、關聯查詢和個性化服務為目標,從語義及約束的表示、模型結構構建及參數學習、知識發現及知識融合等方面,擴展現有方法,基於數據密集型和計算密集型計算平台與技術,提出了數據清洗與獲取、模型構建與最佳化、個性化服務與知識融合方法,將模型的構建與機率推理方法用於Web服務數據和社交媒體數據分析。通過理論分析和實驗測試,驗證了方法的高效性、正確性和可用性,也設計並開發了相應的實驗平台和軟體系統。 作為這些研究結果的體現,本項目資助在本領域國內外重要期刊及會議上發表了40篇學術論文(其中SCI收錄及源刊13篇,EI收錄及源刊31篇次);在World Scientific出版社出版專著1部,參編譯著1部;申請發明專利12項(其中授權3項,公開或受理9項),申請獲得計算機軟體著作權登記6項;獲得省部級人才計畫或獎勵3項。依託本項目的研究,培養青年教師5名,博士生畢業3名、在讀6名,碩士生畢業39名、在讀21名。