雲計算環境下海量XML數據管理關鍵技術研究

《雲計算環境下海量XML數據管理關鍵技術研究》是依託東北大學,由趙相國擔任項目負責人的面上項目。

基本介紹

  • 中文名:雲計算環境下海量XML數據管理關鍵技術研究
  • 項目類別:面上項目
  • 項目負責人:趙相國
  • 依託單位:東北大學
中文摘要,結題摘要,

中文摘要

XML已被廣泛套用於Web數據交換和存儲領域,數據量呈指數級增長,傳統XML數據管理技術已無法滿足海量XML數據管理的要求。雲計算技術在處理大規模數據集中具有性能和成本優勢,已成為海量數據存儲和查詢處理最合適的技術體系,但利用雲計算技術無法有效地處理具有半結構化特點的XML數據。本項目圍繞海量XML數據管理所面臨的問題,針對雲計算環境下海量XML數據存儲技術、索引技術和查詢處理技術展開研究。解決雲計算環境下海量XML數據的數據存儲模型和分散式存儲技術;進而研究海量XML數據的分散式索引構建和維護技術;研究海量XML數據的關鍵字查詢、Twig查詢和XPath/XQuery等查詢處理技術。設計實現一個基於雲計算環境的海量XML數據管理原型系統,來驗證研究成果的正確性和有效性。研究成果將為海量XML數據管理套用提供有力的理論支持和解決方案,具有重要的理論和實踐意義。

結題摘要

海量XML數據已被廣泛套用於網際網路領域;雲計算技術已成為海量規模數據存儲和查詢處理最合適的技術體系,將海量XML數據管理與雲計算技術相結合成為趨勢。管理海量規模的XML數據引入雲計算技術體系,導致傳統XML數據存儲策略和處理算法無法直接高效套用,項目的主要研究目標是針對雲環境下海量規模的半結構化XML數據,從海量XML數據的存儲模型、分散式數據分片與放置策略、海量XML數據的管理模型、海量XML數據查詢處理的分散式執行策略等方面,研究海量XML數據存儲與查詢處理的相關理論與技術,並提出有效的解決方案。因此,本項目研究了大規模XML文檔的分散式存儲策略、分散式XML文檔的節點編碼方案、分散式關鍵字查詢處理與最佳化技術;研究了XML文檔任意分片方法、XML文檔的分散式Twig查詢處理與最佳化技術;在XML文檔分類處理方面,研究了XML文檔表達模型與ELM改進算法、雲環境下的XML文檔分類問題、社交媒體流中的XML文檔分類問題、不確定定XML文檔分類問題等。經過項目組成員為期四年的共同努力,本項目在理論研究、學術交流和人才培養等方面取得了大量成果。在理論研究方面,共獲授權發明專利4項,發表XML數據管理領域學術論文17篇,包括《JCST》、《WWWJ》、《NEUROCOMRUTING》、《MPE》等學術期刊,以及APWEB、EML、BIGCOM等國際學術會議。上述17篇論文被SCI收錄9篇,被EI收錄12篇,此外還有2篇SCI源錄用待發表論文,在學術交流方面,項目組成員和碩博士研究生四年來共18人次參加了重要的學術會議,與相關領域的專家和同行進行了廣泛而深入的交流。在人才培養方面,協助培養博士研究生4人,3人已順利畢業,1人留校東北大學任教;協助培養碩士研究生4人,獨立培養碩士研究生7人,已順利畢業,充實到國內知名的IT產業公司。

相關詞條

熱門詞條

聯絡我們