大數據時代新聞推薦模型與方法研究

大數據時代新聞推薦模型與方法研究

《大數據時代新聞推薦模型與方法研究》是依託廈門大學,由洪文興擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:大數據時代新聞推薦模型與方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:洪文興
  • 依託單位:廈門大學
項目摘要,結題摘要,

項目摘要

大數據技術是當前研究與行業套用的熱門問題;新聞信息是大數據時代的一個典型案例;個性化推薦用於解決新聞信息過載和信息迷航問題。結合數據量大、數據類型繁多、時效性嚴、準確度高的大數據特徵,課題提出新的推薦模型和方法,並開發完整的新聞推薦平台,完成理論、技術、算法和平台建設四個方面的工作。主要創新點包括:(1)基於多源異構新聞數據的用戶興趣建模。將用戶個人信息、閱讀歷史、社交網路信息、用戶反饋等以超圖的形式表示,開展基於超圖的用戶建模研究。在此基礎上,依據用戶的閱讀興趣,對新聞進行排序和選擇。(2)定義子模函式,將新聞推薦轉化為預算型最大覆蓋問題,確切反套用戶閱讀興趣的衰減,結合新聞時效性和地域性,幫助用戶選擇新聞。(3)從時間、空間、主題和命名實體多個維度展示新聞推薦結果。套用數據可視化技術,對新聞立方體各個維度進行鑽取、上卷和切片,以全面展示推薦結果。

結題摘要

大數據技術是當前研究與行業套用的熱門問題,新聞信息是大數據時代的一個典型案例。本研究將個性化推薦用於解決新聞信息過載和信息迷航問題。結合數據量大、數據類型繁多、時效性嚴、準確度高的新聞大數據特徵,課題提出一種適於大規模新聞信息的推薦框架,給出多維度用戶建模、多源新聞建模的方法,以及基於個性化隱變數模型的新聞推薦算法,並開發實施完整的新聞推薦平台,按期完成了“理論、技術、算法和平台建設”四個方面的研究工作。 在用戶建模方面,所提出的方法融合用戶的多類特徵,例如基本信息、用戶行為特徵與分類業務擴展特徵等,用以解決推薦過程中遇到的不同問題。在新聞推薦系統中,基本信息用以解決冷啟動問題,用戶行為特徵主要用以構造用戶長期模型,分類業務擴展特徵用以構造用戶短期興趣模型。研究將這種模型和思推廣套用到求職網站,用於求職者建模,也取得不錯的效果。在新聞建模方面,與用戶建模相似,研究將非結構化數據轉換為結構化數據,同時考慮新聞的基本特徵、文本特徵和命名實體,形成較為完備的特徵空間。 在上述特徵建模的基礎上,對於推薦系統中的隱變數模型,基於分段線性模型的想法,將個性化隱變數模型推廣為分層隱變數模型,使得每一類的用戶和物品都有相應的隱變數模型。研究採用神經網路算法對用戶和物品進行聚類,從而實現一種基於模型的推薦算法和平台。 研究共發表論文6篇,其中1篇SCI收錄、5篇EI收錄,獲得軟體著作權1項,申請專利1項,完成並上線實驗站點,並幫助課題組開啟金融文本大數據分析的相關研究,取得很好的資助效果。

相關詞條

熱門詞條

聯絡我們