雲計算中TB/PB級海量數據近似查詢處理技術的研究

《雲計算中TB/PB級海量數據近似查詢處理技術的研究》是依託哈爾濱工業大學,由楊東華擔任項目負責人的面上項目。

基本介紹

  • 中文名:雲計算中TB/PB級海量數據近似查詢處理技術的研究
  • 依託單位:哈爾濱工業大學
  • 項目類別:面上項目
  • 項目負責人:楊東華
項目摘要,結題摘要,

項目摘要

青年科學基金項目在國內外率先開展了基於雲計算環境的TB/PB級海量數據查詢處理的研究工作,主要圍繞精確查詢處理,提出了一些TB/PB級海量數據查詢處理的關鍵理論和技術。目前還在繼續進行這方面的研究工作。到目前為止,已在國內外知名期刊和會議上發表學術論文12篇(國際期刊3篇,國際會議1篇,國內一級期刊4篇,國內會議4篇),其中SCI檢索3篇,EI檢索8篇。在審文章5篇,其中國際期刊文章4篇(資料庫頂級國際期刊TKDE 2篇),資料庫頂級國際會議VLDB 2012 1篇。本課題在已有研究成果的基礎上,將研究雲計算中TB/PB級海量數據近似查詢處理的關鍵技術和理論,主要包括:支持近似查詢處理的海量數據存儲和索引方法;海量數據近似選擇、連線和分組等基礎操作算法;海量數據概要信息和代表性信息近似查詢處理算法;並研製相應的TB/PB級海量數據近似查詢處理系統原型。

結題摘要

近年來,各行業的信息量呈爆炸性增長趨勢,一些科學套用中的數據量已經從幾十個TeraBytes發展到PetaBytes並且在不斷擴大。現有數據管理方法無法提供TB/PB級海量數據有效的存儲與查詢支持。如何有效地存儲、管理這些TB/PB級海量的數據集合,高效地支持各種複雜的查詢是資料庫領域面臨的一個新的挑戰性問題。該課題在國內外率先開展了雲計算中TB/PB級海量數據近似查詢處理的相關研究工作,提出了一些TB/PB級海量數據近似查詢處理的關鍵理論和技術,主要包括支持近似查詢處理的海量數據存儲和索引方法;海量數據近似連線和近似聚集等基礎操作算法;海量數據概要信息和代表性信息近似查詢處理算法;並研製了相應的TB/PB級海量數據近似查詢處理系統原型用於驗證算法的有效性和準確性。

相關詞條

熱門詞條

聯絡我們