可擴展的高效XML數據管理關鍵技術研究

可擴展的高效XML數據管理關鍵技術研究

《可擴展的高效XML數據管理關鍵技術研究》是依託中國人民大學,由陸嘉恆擔任項目負責人的面上項目。

基本介紹

  • 中文名:可擴展的高效XML數據管理關鍵技術研究
  • 項目類別:面上項目
  • 項目負責人:陸嘉恆
  • 依託單位:中國人民大學
項目摘要,結題摘要,

項目摘要

隨著XML數據在各行各業的廣泛套用,XML數據規模不斷增大,由此帶來的針對分散式海量XML數據管理問題,成為學術界和企業界一個亟待解決的重要課題。本項目研究可擴展的高效XML數據的存儲,索引,查詢和更新機制。首先,我們擬研究針對XML的key-value存儲方案;其次,我們考察基於map-reduce編程框架的分散式XPath和XQuery查詢處理和最佳化技術;然後我們擬研究分散式的基於B樹結構的XML索引和更新機制,最後我們將建立一個海量分散式XML數據的存儲和查詢的原型系統。針對目前海量半結構化數據管理的挑戰,本研究不但具有學術價值,而且還具有廣泛的套用前景。

結題摘要

可擴展標記語言(eXtensible Markup Language,XML)是Internet上一種新的數據表示、存儲和交換標準。XML推薦標準1.0版發布於1998年2月,之後迅速在全球掀起了XML套用的浪潮。 隨著XML數據在各行各業的廣泛套用,XML數據的規模不斷增大,由此帶來的針對海量XML數據的存儲和高效查詢等機制的研究成為學術界和企業界一個亟待解決的重要課題。為了滿足針對海量XML數據高效處理的需求,可擴展的XML數據管理技術就成為了我們研究的方向。本課題組的全體成員通過四年的努力,在分散式海量XML數據管理技術方面有所新的發現和突破,基於該課題發表了一批國際一流的學術論文,推動了該領域的研究和發展。 具體的來說,本課題(1)研究了XML的存儲和關鍵字查詢技術,提出了針對海量數據的高效查詢改寫的算法,成果發表在SIGMOD, ACM TODS等頂級期刊會議上;(2)研究了多種XML查詢的算法,包括分散式XPath和XQuery查詢處理, 擴展樹結構,通配符結構等,大大提高了XML數據查詢處理的能力;成果發表在VLDB Journal等期刊中;(3)研究了海量異構數據的索引更新和Hadoop Mapreduce 的性能最佳化技術,提出了一套新的體系結構,研究成果發表在VLDB 2014等國際會議中,獲得廣泛關注。 本課題在國際交流合作、論文發表、人才培養及專利申請方面均取得一定成果,包括:1)在國內外一流會議期刊發表論文16篇,其中國際資料庫頂級會議SIGMOD 發表研究長文兩篇,VLDB 一篇,國際資料庫頂級期刊VLDB Journal 一篇,和 ACM Trandaction on data management 兩篇等;2)申請發明專利3項,軟體著作權7項,出版關於XML的全英文專著一本;3)培養碩士研究生12名,博士研究生3名;4)研究內容作為本科生和研究生教材,相關課程獲教育部IBM精品課程稱號,相關教材獲得北京市精品教材的稱號;5)與新加坡國立、南洋理工、法國電信研究院、南丹麥科技大學等建立學術交流互訪活動;6)課題組組長擔任ICDE,SIGMOD等國際頂級會議的Proceeding chair, workshop chair, PC member 等學術兼職。

相關詞條

熱門詞條

聯絡我們