《異構環境下基於社交數據的大規模本體學習模型研究》是依託清華大學,由鄭海濤擔任項目負責人的面上項目。
基本介紹
- 中文名:異構環境下基於社交數據的大規模本體學習模型研究
- 依託單位:清華大學
- 項目負責人:鄭海濤
- 項目類別:面上項目
項目摘要,結題摘要,
項目摘要
社交網路已經成為人們通過網路進行信息活動的重要媒介,社交數據隨著人們網路社交活動的增加呈現爆炸性的增長,已經成為網際網路上的重要信息來源之一。針對社交數據的語義分析結果已經成為網路監督、網路偵測、網路知識發現、網路行為分析、以及網路信息檢索等套用的重要基礎。然而,針對社交數據的語義分析存在異構性、大規模性、以及歧義性等問題。因此,本項目通過構建基於社交數據的本體學習模型來解決以上科學問題。我們提出基於領域的社交網路話題模型對異構環境下的社交數據建模,採用遷移學習的方法對不同領域的關鍵概念進行抽取,基於規範信息距離衡量概念之間的語義關係;構建基於雲計算的本體學習模型解決大規模本體學習的強耦合性和低可靠性問題;提出基於社交網路的實體去歧義化方法,基於Dempster-Shafer證據理論和Shapley 熵提出語義關係的動態可信度計算模型,從而實現一套對社交網路行之有效的語義分析理論和算法。
結題摘要
社交網路已經成為人們通過網路進行信息活動的重要媒介,社交數據隨著人們網路社交活動的增加呈現爆炸性的增長,已經成為網際網路上的重要信息來源之一。針對社交數據的語義分析結果已經成為網路監督、網路偵測、網路知識發現、網路行為分析、以及網路信息檢索等套用的重要基礎。然而,針對社交數據的語義分析存在異構性、大規模性、以及歧義性等問題。 因此,本項目通過構建基於社交數據的本體學習模型來解決以上科學問題。我們提出基於領域的社交網路話題模型對異構環境下的社交數據建模,採用遷移學習的方法對不同領域的關鍵概念進行抽取,基於規範信息距離衡量概念之間的語義關係,在此基礎上,我們將語義關係融入到文本摘要模型中,在多個公開的標準評測集上的結果表明了我們所提出方法的優越性;構建基於雲計算的本體學習模型解決大規模本體學習的強耦合性和低可靠性問題,在此基礎上,我們對線上特徵選擇,文本聚類進行了改進,提升了對大規模社交數據的分析效果;提出基於社交網路的實體去歧義化方法,基於Dempster-Shafer證據理論和Shapley 熵提出語義關係的動態可信度計算模型,在此基礎上,我們將社交網路的最佳化模型融入到推薦模型中,在多個真實的數據集上證明了所提出方法的有效性。