社會化媒體中的數據管理和挖掘研究

《社會化媒體中的數據管理和挖掘研究》是依託北京大學,由崔斌擔任負責人的面上項目。

基本介紹

  • 中文名:社會化媒體中的數據管理和挖掘研究
  • 項目負責人:崔斌
  • 項目類別:面上項目
  • 依託單位:北京大學
項目摘要,結題摘要,

項目摘要

Web 2.0熱潮極大地推動了網際網路的迅速發展,其中社會化媒體作為新型網際網路線上媒體套用系統吸引了越來越多用戶的參與。社會化媒體中用戶參與的協作方式引導網際網路信息的產生和消費,使其數據內容和特徵與傳統數據有著顯著區別。社會化媒體系統中數據規模大、數據類型豐富、結構多樣而且相互關聯等特徵,對數據管理和數據挖掘領域的研究人員提出了新的研究課題。本項目申請旨在研究社會化媒體數據管理和挖掘的一些關鍵技術,主要包括數據模型、組織索引、檢索和數據挖掘等,以期實現該類系統中的複雜數據的高效管理,挖掘其數據中蘊含的知識,來更好地支持網際網路系統套用和用戶體驗。在上述理論研究成果的基礎上,研製社會化媒體檢索和挖掘原型系統,驗證本項目研究中提出的新理論和新方法。

結題摘要

社會化媒體套用系統作為新型網際網路線上媒體套用系統吸引了越來越多用戶的參與,其用戶參與的協作方式引導網際網路信息的產生和消費。由於社會化媒體系統中數據量大、數據類型豐富、結構多樣關聯特徵,對數據管理和數據挖掘領域的研究人員提出了新的研究挑戰。社會化媒體的巨大潛力已經吸引越來越多的研究人員的關注,成為資料庫研究領域的一個熱點。本項目研究社會化媒體數據管理和挖掘的一些關鍵技術,主要包括數據模型、組織索引、檢索和數據挖掘等,實現該類系統中的複雜數據的高效管理,挖掘其數據中蘊含的知識,來更好地支持網際網路系統套用和用戶體驗,比如搜尋引擎、多媒體檢索、資源推薦等。本項目工作進展基本按照年度計畫進行,具體研究內容包括: (1) 利用社會化媒體環境提供的多種資源來有效描述數據對象,設計新的數據模型表示多模態特徵以及相互關聯特性; (2) 進行社會化媒體數據組織、索引和檢索研究,包括不同數據的組織和索引結構設計,新的相似度計算方法和查詢算法; (3) 關注數據內容特徵、結構關聯和用戶信息等方面,研究對面向社會化媒體數據對象挖掘關鍵算法與核心技術,支持信息推薦和熱點挖掘等系統套用。通過本項目的研究,我們圓滿完成了預期目標。具體研究成果如下: (1) 理論成果:在社會化數據管理和挖掘關鍵技術的理論和方法研究方面取得了國際認可的研究成果;基於本項目的研究內容已經在國內外期刊和會議上發表論文21篇,其中CCF A類國際期刊和會議論文8篇(包括TKDE,TOIS,ICDE 3,VLDB 2,KDD),SCI 7篇,EI 20篇;獲WISE 2013國際會議 Best Student Paper。 (2)系統成果:搭建了一個收集和維護大規模社會化數據的研究平台,收集了超過20T的社會化媒體數據,實現多種檢索和挖掘算法,為後續研究以及同類研究打下良好基礎。申請美國專利1項(申請號PCT/CN2012/073403),國內專利2項(CN 201110373475,CN 201110374380)。 (3)人才培養:培養博士6名(畢業2名)和碩士5名(畢業3名),其中一名博士論文獲“北京大學優秀博士論文”,兩名學生獲北京大學信息學院“研究生學術十傑”。

相關詞條

熱門詞條

聯絡我們