大規模OWL本體的分散式調試方法研究

《大規模OWL本體的分散式調試方法研究》是依託東北大學,由吳剛擔任項目負責人的面上項目。

基本介紹

  • 中文名:大規模OWL本體的分散式調試方法研究
  • 項目類別:面上項目
  • 項目負責人:吳剛
  • 依託單位:東北大學
中文摘要,結題摘要,

中文摘要

語義Web的發展促使大量OWL本體在Web上發布並互連成連結數據。這種開放連結方式下,本體自身演化或本體間連結更新都可能導致邏輯衝突。通常可採用本體調試技術,通過找出一組最小衝突公理集合作為調試信息的方法來幫助定位並解釋衝突原因。目前尚無證據表明已有的本體調試技術及最佳化方法能有效處理含十億數量級三元組的OWL本體。當前急需新的OWL本體調試技術來解決在Web 規模本體上進行有效邏輯衝突調試及推理結果解釋等問題。課題擬採用分散式處理技術突破I/O和主存對大規模OWL本體存儲和處理能力的限制,研究大規模OWL本體的高效調試和解釋方法,內容涉及分散式環境下支持OWL本體調試的存儲結構設計;求取本體調試信息(最小衝突公理集合)的分散式算法及最佳化技術;存儲更新和增量式求取算法;面向用戶的調試信息度量和Top-k算法;近似調試算法。擬將成果用於構建一個提供大規模OWL本體線上調試和解釋服務的原型系統。

結題摘要

語義Web的發展促使大量OWL本體在Web上發布並互連成連結數據。這種開放連結方式下,本體自身演化或本體間連結更新都可能導致邏輯衝突。通常可採用本體調試技術,通過找出一組最小衝突公理集合作為調試信息的方法來幫助定位並解釋衝突原因。目前尚無證據表明已有的本體調試技術及最佳化方法能有效處理含十億數量級三元組的OWL本體。當前急需新的OWL本體調試技術來解決在Web 規模本體上進行有效邏輯衝突調試及推理結果解釋等問題。課題採用分散式處理技術突破I/O和主存對大規模OWL本體存儲和處理能力的限制,研究了一系列大規模OWL本體的高效調試和解釋方法。 在分散式環境下支持OWL本體調試的存儲結構設計方面,分別提出了將本體和調試信息存儲於Hadoop HDFS,以及存儲於Cassandra分散式資料庫兩套方案。此外,針對分散式本體調試的特點,研究了分散式記憶體資料庫集群系統的可用性。 在存儲更新和增量式求取算法方面,提出了在本體增加和刪除情況下的本體調試信息的更新策略,以支持動態進行本體推理與調試信息更新。設計了相關快取機制,避免重複求取所推理的蘊含集。 在求取本體調試信息的分散式算法及最佳化技術方面,分別研究了採用MapReduce計算模型的方法,以及採用基於記憶體的分散式計算框架Spark,提升實時計算和疊代計算性能的方法。此外,提出先構造與調試目標相關的依賴子圖,再基於依賴子圖進行調試的最佳化策略,通過減小搜尋空間來加快調試速度。 在面向用戶的調試信息度量和Top-k算法方面,提出一套面向用戶認知的OWL本體辯解度量指標,綜合考慮複雜度、相關度和新穎度三方面,並在此基礎上,採用ListNet 排序學習方法構造Top-k辯解排序模型。該方法在辯解排序準確率方面表現良好。 總計發表論文(含錄用)15 篇,其中期刊論文9 篇,會議論文6篇,SCI 檢索2 篇,EI 檢索7 篇;授權國家發明專利4項;人才培養方面,先後培養碩士生16 名;國際交流合作方面,與南京大學、東南大學、清華大學進行了廣泛合作交流。 成果理論意義:(1)結合資料庫領域的相關思想和理論,解決了本體調試信息的有效存儲與管理問題;(2)利用多種分散式計算模型,提高調試信息求解性能;(3)結合信息檢索和機器學習領域的研究成果,提高了調試結果排序準確性問題。成果套用價值:構建了一個能夠提供大規模OWL本體線上調試和解釋服務的原型系統。

相關詞條

熱門詞條

聯絡我們