大規模圖數據集成關鍵技術研究

《大規模圖數據集成關鍵技術研究》是依託北京大學,由高軍擔任負責人的面上項目。

基本介紹

  • 中文名:大規模圖數據集成關鍵技術研究
  • 項目負責人:高軍
  • 項目類別:面上項目
  • 依託單位:北京大學
項目摘要,結題摘要,

項目摘要

不同套用領域中湧現的大圖數據存在互補,大圖數據集成將豐富個體數據特徵,有效支持信息推薦、客戶評估等諸多套用。面對大圖數據集成和服務中不確定性、海量數據、隱私保護等挑戰,本課題從關鍵技術和原型系統兩個層面展開研究。.在關鍵技術層面,本課題將研究大圖數據的通用集成方法,擬提出基於遷移學習的隱含屬性疊代推測方法、基於用戶反饋的多特徵機率集成方法、隱私保護感知的高精度群體查詢策略;本課題將研究分散式環境中大圖數據集成的最佳化策略,擬提出感知局部內容+結構的初始映射構建方法、基於三階段訊息擴展的分散式大圖集成方法、同時支持線上查詢和離線分析的分散式圖數據處理框架的擴展機制;本課題將研究面向套用領域的大圖數據集成,擬提出面向最少元搜尋的知識網路集成方法、基於推薦反饋的社交網路集成方法等。.在原型系統層面,本課題擬利用現有的分散式大圖計算框架Giraph,研製面向社交網路和知識網路的大圖數據集成原型系統。

結題摘要

不同套用領域中湧現的大圖數據存在互補,大圖數據集成將豐富個體數據特徵,有效支持信息推薦、客戶評估等諸多套用。面對大圖數據集成和服務中不確定性、海量數據、隱私保護等挑戰,本課題從關鍵技術和原型系統兩個層面展開研究。在關鍵技術層面,本課題研究了大圖數據的通用集成方法,提出了基於遷移學習的隱含屬性疊代推測方法、基於用戶反饋的多特徵機率集成方法、隱私保護感知的高精度群體查詢策略;本課題研究了分散式環境中大圖數據集成的最佳化策略,提出了感知局部內容+結構的初始映射構建方法、基於三階段訊息擴展的分散式大圖集成方法、同時支持線上查詢和離線分析的分散式圖數據處理框架的擴展機制;本課題研究了面向套用領域的大圖數據集成,提出了面向最少元搜尋的知識網路集成方法、基於推薦反饋的社交網路集成方法等。在原型系統層面,本課題利用現有的分散式大圖計算框架Giraph,研製了面向社交網路和知識網路的大圖數據集成原型系統。課題執行期間,課題組將研究的關鍵技術成果套用於實際系統,並根據實際套用的反饋最佳化研究路線。套用中我們發現,單純結構信息不足以支持用戶套用,融合內容、結構、時間、空間等特徵才能實現有效的圖數據分析。課題組以異構信息網路為數據模型,設計圖神經網路融合多源異構信息,支持商品推薦、異常發現等套用。課題執行期間,發表CCF A類會議或者期刊論文9篇(包括VLDB J、TKDE, ICDE、AAAI、IJCAI等),B類會議(包括CIKM)論文一篇,申請2項專利,課題組研究生畢業3名,成果套用於阿里和國家政務相關的場景。

相關詞條

熱門詞條

聯絡我們