管理與決策大數據分析方法與個性化知識服務

《管理與決策大數據分析方法與個性化知識服務》是依託中國科學技術大學,由陳歡歡擔任項目負責人的重大研究計畫。

基本介紹

  • 中文名:管理與決策大數據分析方法與個性化知識服務
  • 項目類別:重大研究計畫
  • 項目負責人:陳歡歡
  • 依託單位:中國科學技術大學
中文摘要,結題摘要,

中文摘要

大數據已成為科技界和企業界關注的熱點,是企業和國家的重要戰略資源。由於大數據分析中同一主題的數據常常來源廣泛、存儲高度分散化、及之間的關係隱式存在、反映主題的不同方面,這樣的“碎片化”存在形式,是大數據出現的新特徵,面對碎片化大數據,傳統的機器學習理論與方法不僅面臨數據“量”的問題,而且面臨知識獲取中“質”的問題。研究支持碎片化數據的智慧型分析方法與個性化知識服務具有非常重要的現實意義。本課題以大數據中知識表示、線上學習與個性化知識服務的三個科學問題為核心,即尋求碎片化多元多源異構知識表示與學習規律,揭示碎片化知識融合與評估機理,構建個性化情景感知與知識適配模型,重點研究多源異構知識表示、動態不確定環境下線上學習、知識融合與湧現特性分析、知識再增殖評估關鍵技術、個性化、社會性情景感知技術,以及個性化知識適配模型等一系列具有創新性及突破性的大數據學習的新理論與新算法。

結題摘要

本項目在執行期間對管理與決策大數據分析方法與個性化知識服務進行了研究,並開展了個性化知識服務示範套用。項目在理論研究及具體套用方面均取得了重要成果,相關概述如下: (1) 提出改進的稀疏貝葉斯模型。結合流行正則化及圖的稀疏先驗的學習算法利用樣本數據的流形信息,可以去除無關的標籤樣本,對樣本外數據進行預測。並通過融合截斷高斯分布和拉普拉斯估計,可為分類任務同時選擇相關特徵和樣本,有效提升了模型對於碎片化知識的表示與學習能力。 (2) 提出在模型空間中進行知識度量以及基於馬爾可夫毯的評估方法。算法同時結合序列數據的動態信息和標籤信息,能有效表示數據的生成模型,並通過動態狀態規整進行知識的對齊,得到知識距離度量結果,為進一步知識融合提供基礎;無因果充分性的馬爾可夫毯挖掘算法採用最大祖先圖模型來表示數據間潛在聯繫,提高了數據間關聯關係挖掘的準確率。 (3) 提出改進的文本表示方法與詞嵌入模型。潛在主題文本表示學習框架利用統計流行測量文本距離來對文本進行分類,感知不同文本的潛在主題;詞嵌入最佳化模型融入可靠的語義詞典提高了辨別反義詞和同義詞的能力;基於相似性的中文詞和字聯合學習方法可以進行漢字消歧以及識別非結構詞實現知識的有效適配。 (4) 開展個性化知識服務示範套用。面向智慧財產權訴訟的個性化智慧型問答平台基於自然語言理解和知識圖譜,融合海量的法律知識,探索問答系統中的信息檢索、知識推理等技術在司法領域的套用,為用戶提供專業且個性化的法律知識服務;面向慢病大數據的個性化智慧診療輔助工具利用線上學習技術,融合專家知識與海量網際網路碎片化知識,對醫療數據進行分析,為患者提供個性化的防治建議和診療服務;面向測繪領域的知識服務系統通過對測繪領域標準規範與網路資源進行融合與分析得到知識的主題表示,並在構建的領域本體上對知識進行關聯表示,為用戶提供相關專業培訓、知識問答、事故分析等個性化服務。

相關詞條

熱門詞條

聯絡我們