基於機率圖模型的不確定數據管理

《基於機率圖模型的不確定數據管理》是依託復旦大學,由沙朝鋒擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於機率圖模型的不確定數據管理
  • 依託單位:復旦大學
  • 項目類別:青年科學基金項目
  • 項目負責人:沙朝鋒
項目摘要,結題摘要,

項目摘要

近年來不確定數據管理成為資料庫領域的研究熱點,人們已經提出各種模型及相應的查詢語言、存儲方法和查詢處理,但是如何利用機率圖模型對數據相關性的良好刻畫,來實現不確定數據的有效管理的工作還比較少。本研究擬用機率圖模型建模方法對不確定數據的管理進行研究,從理論上探索機率圖模型對不確定數據的表示、不確定數據上查詢的複雜性及基於機率推斷的近似算法、高效的不確定數據上複雜聚集查詢處理算法、基於機率圖模型不確定數據挖掘算法,探索如何使用關係資料庫中查詢最佳化技術來實現高效的機率推斷算法,並開發集成這些研究工作的原型系統。本項目所研究的內容屬於不確定數據管理的核心技術,研究所提供的理論和方法將在一定程度上促進該領域的理論進展和商業不確定數據管理系統的開發,研究還將提供實用的技術,研製具有我國獨立智慧財產權的不確定數據管理技術。

結題摘要

近年來,隨著感測器、RFID 和信息抽取等技術的出現,以及人們對數據採集和處理技術理解的不斷深入,如何使用不確定數據(uncertain data)對現實世界進行建模以及相應的數據管理問題得到了廣泛的關注。在許多現實套用中,如Web 信息抽取、環境監測、物流管理、軍事、金融、電信等領域,數據的不確定性普遍存在,不確定數據的管理技術將扮演重要角色。課題組用機率圖模型建模方法對不確定數據的管理進行研究,從理論上探索圖模型對不確定數據的表示。具體地,我們對不確定數據相似性查詢(高維不確定數據相似性查詢的快速處理、不確定數據流ER-topk查詢等)、機率XML數據的管理(機率XML數據上的關鍵字過濾、基於貝葉斯網路的關鍵字過濾等)、不確定數據世系管理、不確定數據挖掘算法(非冗餘多樣性模式的挖掘、半監督PU學習、數據不確定性或噪聲的去除等)、不確定數據的訪問控制與隱私保護等進行了深入研究。這些理論結果在從淘寶等抓取的真實數據上進行了詳細的實驗,檢驗了我們所提出方法的有效性和效率。在該基金項目的支持下,課題組三年來在國內外高水平學術會議和期刊上已發表或錄用論文12篇。本項目所研究的內容屬於不確定數據管理的核心技術,研究所提供的理論和方法將在一定程度上促進該領域的理論進展和商業不確定數據管理系統的開發。

相關詞條

熱門詞條

聯絡我們