不確定數據管理的理論與關鍵技術

《不確定數據管理的理論與關鍵技術》是依託東北大學,由王國仁擔任項目負責人的重點項目。

基本介紹

  • 中文名:不確定數據管理的理論與關鍵技術
  • 項目類別:重點項目
  • 項目負責人:王國仁
  • 依託單位:東北大學
中文摘要,結題摘要,

中文摘要

隨著計算機套用技術的快速發展,感測器網路、Web服務和RFID技術得到了廣泛套用,在這些先進套用中不確定數據無處不在,無法運用確定性數據管理技術有效處理。現有的不確定數據管理技術主要集中於機率關係數據管理技術方面,而面向更複雜的不確定數據類型的數據管理技術則仍然遠未成熟。本項目將重點圍繞半結構化數據(圖和XML)和流數據(包括感測器網路和RFID)開展不確定數據管理理論與關鍵技術的研究工作,力爭在不確定數據的數據建模、存儲與索引、查詢處理和世系分析等理論、方法與技術方面取得原創性的突破成果,並且通過構建2個原型系統來驗證這些研究成果的有效性,預期在國內外重要學術期刊和學術會議上發表高水平學術論文40餘篇。相關研究成果將為新興套用的數據管理提供新的解決方案,具有重要的理論意義與實踐價值。

結題摘要

本項目的執行時間是2010.1——2013.12,這期間項目主要從不確定半結構化數據和流數據兩方面展開了研究工作,現總結如下: 1.在不確定半結構化數據(圖和XML)管理方面,提出了可擴展的機率獨立數據模型和機率關聯數據模型(Markov網路和Bayesian網路);提出了基於機率矩陣和機率鄰接鍊表的存儲模型,可高度壓縮數據並充分表達模型語義;提出了基於機率路徑樹索引、基於頻繁子圖的索引、基於Junction Tree的索引來高效地處理不確定圖數據的可達查詢、不確定圖數據的包含查詢和不確定XML數據的關鍵字查詢;提出了基於動態規劃的近似算法和基於蒙特卡羅的採樣算法高效地解決了基於機率語義和期望語義的大規模不確定圖挖據問題。其中關於不確定圖數據的查詢處理與挖掘的一系列算法是本課題成員在國際上率先提出來的,奠定了我國在不確定圖數據管理研究領域的國際領先地位。 2.在不確定流數據(包括感測器網路和RFID)管理方面,主要研究了不確定感測數據的查詢處理與監控算法和不確定RFID數據管理的框架。針對“不確定感測數據的查詢處理”,提出了無線感測器網路 (ε, δ) –近似Top-k查詢處理算法、無線感測器網路中ε-近似區域聚集算法、感測器網路中不確定數據反向輪廓查詢處理算法、針對感測器網路不確定數據的髒事件清洗技術等。針對“不確定RFID數據管理的框架”,提出了基於監控對象動態聚簇的RFID數據清洗、基於機率軌跡模型的RFID軌跡填補、截止期敏感的RFID複雜事件處理技術、半限制空間內的可能性k-近鄰查詢技術、亂序流上基於置信度的即時事件處理技術等。 3. 本項目實施過程中,項目組已在VLDB Journal、IEEE TKDE、IEEE TPDS等國際權威期和本領域重要的國際會議(SIGMOD、VLDB、ICDE等)上發表(含已錄用)論文98篇,其中SCI期刊發表論文36篇。培養畢業研究生28名,申請公開國家發明專利12項。項目組通過積極參與相關領域主流國際會議、邀請國外專家訪問等方式,與國外同行進行了深入的學術交流與合作。

相關詞條

熱門詞條

聯絡我們