《異質信息網路的聚類分析研究》是依託北京郵電大學,由石川擔任項目負責人的面上項目。
基本介紹
- 中文名:異質信息網路的聚類分析研究
- 項目類別:面上項目
- 項目負責人:石川
- 依託單位:北京郵電大學
項目摘要,結題摘要,
項目摘要
當前的社會網路分析主要針對同質網路(即網路中結點類型相同),但是現實世界中的網路化數據通常包含不同類型的對象,並且對象之間的關聯表示不同的語義關係。構建異質信息網路(即包含不同類型的結點或邊的網路)可以包含更加完整的對象之間的關聯信息,因此分析這類網路有希望挖掘更加準確的模式。本課題以異質信息網路為對象,深入分析異質網路的複雜結構和豐富語義對數據挖掘帶來的挑戰。本課題將針對一般結構的異質信息網路,充分利用異質網路的語義信息,深入研究其中的聚類分析及其相關問題。具體研究內容包括:基於語義路徑的相似性計算,基於複雜網路結構的聚類分析和動態異質網路的聚類分析。通過這些研究,探索一般結構的異質信息網路的異質對象處理方法和關係語義挖掘技術。本項目的研究成果將拓展社會網路分析的研究內容,並提出異質信息網路建模和分析方法。
結題摘要
社會網路分析在計算機科學領域,特別是數據挖掘領域,逐漸成為主流方向。當前的社會網路分析主要基於同質信息網路,隨著線上社交媒體、信息物理系統的大量出現,對象相互關聯形成的複雜網路很難用同質信息網路建模,需要建模成異質信息網路。複雜的網路結構和豐富的語義信息對基於異質信息網路的數據挖掘提出了嚴峻的挑戰。本課題以異質信息網路為對象,通過研究其中的聚類分析及其相關任務,深入分析異質信息網路的異質對象處理和關係語義挖掘方法。主要研究內容包括:基於語義路徑的相似性計算;基於複雜網路結構的聚類分析;基於異質信息網路的推薦方法。 本課題的主要代表性研究成果如下:(1)研究了異質信息網路中的相似性度量問題,提出了HeteSim標準用於度量異質信息網路中任意兩個節點的相關性,提出了HRank方法度量節點和元路徑的重要性;(2)提出基於網路分解的異質網路聚類方法HeProjI將異質信息網路分解成若干個簡單的子網路後分而治之,更能適應實際網路化數據中複雜且不規則的結構;(3)提出基於異質信息網路的語義推薦方法SemRec,通過帶權元路徑靈活地整合異質信息,同時學到個性化權重來表達用戶對路徑的偏好,並進一步地提出一種可解釋的語義個性化推薦方法;並研製了可解釋的推薦系統RecExp;(4)在國際頂級期刊TKDE上發表了異質信息網路分析的第一篇綜述論文;在Springer發表異質信息網路方向第一部英文專著。 總體來說,本項目按照計畫執行,超額完成了研究目標。本項目的研究成果在國內外做特邀報告6次;舉辦國際研討會4次;社交網路973項目結題將該成果選為代表性工作。在本項目的資助下,發表主要相關論文42篇,其中知名SCI國際期刊文章5篇,CCF A類論文2篇,B類論文6篇,C類論文10篇。取得1項軟體著作權和9項發明專利。