面向大規模RDF數據的分散式處理技術研究

《面向大規模RDF數據的分散式處理技術研究》是依託東南大學,由吳剛擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:面向大規模RDF數據的分散式處理技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:吳剛
  • 依託單位:東南大學
中文摘要,結題摘要,

中文摘要

語義Web作為數據之網不斷匯集並組織Web信息,相關套用因此面臨著對語義Web所含大規模RDF數據高效訪問的挑戰。利用分散式處理技術提高性能是一種解決之道,其核心是RDF數據的放置策略、分散式查詢處理與最佳化。已有工作尚未系統研究RDF數據放置策略的分類與特點,及其對分散式查詢處理與最佳化的影響。本課題將首先分析RDF數據上各類數據放置策略及其影響。然後擬通過混合水平與垂直劃分的方法實現分散式查詢負載平衡與通信開銷降低,並充分利用查詢操作內與操作間兩種並行性實現查詢執行性能的提高。具體擬提出基於RDF模式子圖頻繁度來混合劃分RDF圖的數據放置策略;提出基於RDF圖索引匹配的查詢分解與分散式查詢處理方法;相應提出基於代價分析的查詢最佳化方法。研究成果將套用於一個已有的語義Web搜尋引擎,改進存儲與檢索效率,驗證方法的可行性和有效性。課題開展對推動語義Web、數據管理和分散式技術的發展具有重要意義。

結題摘要

語義Web作為數據之網不斷匯集並組織Web信息,相關套用因此面臨著對語義Web所含大規模RDF數據高效訪問的挑戰。利用分散式處理技術提高性能是一種解決之道,其核心是RDF數據的放置策略、分散式查詢處理與最佳化。已有工作尚未系統研究RDF數據放置策略的分類與特點,及其對分散式查詢處理與最佳化的影響。本課題首先分析了RDF數據上各類數據放置策略及其影響。然後提出了一種新的基於頻繁RDF圖模式劃分的並行RDF數據處理方法;針對RDF數據的結構化查詢處理,提出了一種基於Prüfer序列化索引的查詢處理方法和一種RDF快取策略;在已有的分散式語義Web推理的基礎上,提出了一種基於MapReduce框架的語義Web推理解釋服務;針對查詢最佳化中普遍存在的組合最佳化問題,研究了使用基於MapReduce的蟻群最佳化技術求解組合最佳化問題的方法;最後在研究成果的基礎上構建了一個利用語義Web搜尋引擎提供支持的語義互聯線上社區系統用以檢驗研究成果的實際效果。項目整體進展順利,按照計畫完成,部分內容稍作調整。在論文發表、學生培養和國內外學術交流方面都取得了較好的成果。隨著相關科研成果的轉化,將進一步促進語義Web技術的快速發展。

相關詞條

熱門詞條

聯絡我們