條件機率圖數據管理關鍵技術研究

《條件機率圖數據管理關鍵技術研究》是依託東北大學,由袁野擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:條件機率圖數據管理關鍵技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:袁野
  • 依託單位:東北大學
中文摘要,結題摘要,

中文摘要

圖是一種通用的數據結構,已套用到科學與工程的各個領域,如計算化學、生物信息學、流體動力學、社會關係學等。而現代科學的研究方法和測量技術普遍存在誤差和噪聲,使獲取的圖數據具有不確定性,例如不確定社會關係網路、不確定道路交通網路、不確定蛋白質互動網路等,促使不確定圖數據管理技術的研究已逐漸成為當前資料庫領域的研究熱點之一。然而現有的針對不確定圖數據管理的研究工作寥寥無幾,主要集中在不確定圖的可達查詢和頻繁子圖挖掘。並且圖模型假設機率獨立,此假設過於嚴格,不符合實際的需求。為此本項目緊緊圍繞條件機率圖數據管理的關鍵技術展開深入研究,力爭在條件機率圖數據模型、存儲與索引、複雜查詢處理等方面取得原創性的突破成果,並通過構建條件機率圖數據管理原型系統來驗證這些研究成果的有效性。相關研究成果將為條件機率圖數據的管理提供新的解決方案,進一步拓寬條件機率圖數據的套用範圍,具有重要的理論意義與實際套用價值。

結題摘要

本項目的執行時間是2011.1——2014.12,這期間項目主要研究了條件機率圖數據管理的各個方面,現總結如下: 1. 在條件機率圖數據模型和存儲方面,項目組提出了機率獨立圖模型、基於Markov網路的無向圖模型、基於Bayesian網路的有向圖模型;並提出通用的機率鄰接鍊表存儲結構、機率鄰接矩陣存儲結構。 2. 在條件機率圖數據查詢處理方面,項目組提出了統一的查詢處理框架,它可高效地處理百萬個數不確定圖數據的包含圖查詢、磁碟駐留不確定圖數據的關鍵字查詢、超大規模單一不確定圖的可達查詢等。該框架可同時無縫地集成項目組研發的高效圖索引:機率路徑樹索引、基於頻繁子圖的索引、機率相似矩陣索引、基於Junction Tree的索引。 3. 在條件機率圖數據分析方面,項目組提出了無偏而低誤差的通用採樣算法,它可高效地處理大規模不確定圖數據的聚類和分類、高效地挖掘千萬結點大圖的頻繁子圖和區分子圖、高效地監控不確定圖數據流的異常點。 4. 本項目實施過程中,項目組已在VLDB Journal、IEEE TKDE、VLDB等國際權威期刊和國際會議上發表論文30篇,其中SCI期刊發表論文13篇,其中的論文獲得遼寧省自然科學學術成果一等獎。培養畢業研究生5名,項目成員的博士論文《不確定圖數據的查詢處理技術研究》獲得2012年中國計算機學會(CCF)優秀博士論文獎和2013年全國優秀博士論文提名獎。開發的條件機率圖數據管理原型系統已經得到套用,並申請國家發明專利2項。關於機率圖數據查詢處理的一系列算法是本課題成員在國際上率先提出來的,奠定了我國在不確定圖數據管理研究領域的國際領先地位。

相關詞條

熱門詞條

聯絡我們