面向XML數據集成的完整性約束挖掘方法研究

面向XML數據集成的完整性約束挖掘方法研究

《面向XML數據集成的完整性約束挖掘方法研究》是依託江蘇理工學院,由葉飛躍擔任項目負責人的專項基金項目。

基本介紹

  • 中文名:面向XML數據集成的完整性約束挖掘方法研究
  • 項目類別:專項基金項目
  • 項目負責人:葉飛躍
  • 依託單位:江蘇理工學院
項目摘要,結題摘要,

項目摘要

在XML數據集成中如何評價XML數據的質量非常重要。然而,國際上對於XML數據質量的評價方法的研究才剛剛開始。完整性約束在數據的質量保障和評價方面有著重要的作用,XML數據中的完整性約束挖掘僅僅在函式依賴及鍵挖掘方面有少量的嘗試性研究報導,許多問題亟待研究。本項目將重點研究面向XML數據集成的鍵挖掘、函式依賴挖掘、包含依賴挖掘、不同數據源集成中的約束轉換和比較、數據轉換中的約束保持分析、集成數據上的約束獲取、關係數據約束與XML數據約束比較等方面的理論、方法、算法,並最終獲得XML數據集成中的約束挖掘、轉換、比較的原型系統。在XML約束挖掘中需要比較樹的路徑,其算法的複雜度與涉及的路徑數量呈指數級關係。擬採用本體方法獲取無關路徑,以減少完整性約束挖掘過程中所涉及的路徑數量,同時,擬研究一種面向XML數據的模式頻數挖掘方法來進一步減少完整性約束挖掘過程中所涉及的路徑數量。

結題摘要

在數據集成中如何評價數據的質量非常重要。然而,國際上對於XML數據質量的評價方法的研究才剛剛開始。完整性約束在數據的質量保障和評價方面有著重要的作用。本項目重點研究包括XML數據集成中的完整性約束挖掘,主要包括XML數據中的鍵挖掘、XML數據中的頻繁模式與關聯規則挖掘、函式依賴挖掘、微分依賴挖掘。同時,還對數據轉換中的約束保持、探測關係約束和XML約束之間的關係等方面進行了探索性研究。提出了基於哈希的函式依賴挖掘、基於推理的XML數據中鍵挖掘方法、發現近似微分依賴等一些有價值的算法,部分成果並已經發表在國際著名期刊或國際會議。

相關詞條

熱門詞條

聯絡我們