顧及空間鄰近性的並行空間資料庫動態均衡分布方法

顧及空間鄰近性的並行空間資料庫動態均衡分布方法

《顧及空間鄰近性的並行空間資料庫動態均衡分布方法》是依託電子科技大學,由周艷擔任醒目負責人的青年科學基金項目。

基本介紹

  • 中文名:顧及空間鄰近性的並行空間資料庫動態均衡分布方法
  • 外文名:A dynamic balanced distribution method for parallel spatial databases considering spatial adjacency
  • 依託單位:電子科技大學
  • 項目類別:青年科學基金項目
  • 項目負責人:周艷
項目摘要,結題摘要,

項目摘要

並行空間資料庫以其高性能、高可用性和高可擴展性等特點,已成為高性能地學計算新型環境下大規模GIS空間數據高效管理的核心技術。由於空間數據分布不均勻、空間對象結構複雜、對象之間包含著複雜的空間關係,導致GIS空間數據並行管理的效率不高,這已成為並行空間資料庫面對GIS數據密集型高性能套用的瓶頸問題。本申請針對並行空間資料庫的空間數據均衡分布難題,綜合考慮空間數據的非結構化變長、非均勻分布和複雜的空間關係等特點,系統研究空間數據量、空間對象分布、空間鄰近關係和空間數據動態更新等影響空間數據分布平衡的關鍵因素,提出顧及空間鄰近性的空間數據均衡分布和基於最小空間鄰近度的空間數據動態偏斜糾正方法,為並行空間資料庫的數據動態均衡分布提供一種新的有效途徑,為地球空間信息格線計算和高性能地學協同等提供重要支撐。

結題摘要

並行空間資料庫是高性能空間資料庫發展的必然趨勢,如果空間數據在並行節點之間分布失衡,就會導致系統負載不平衡,影響空間資料庫並行性能發揮。因此空間數據均衡分布是提高並行空間資料庫性能的核心關鍵技術之一。本項目針對並行空間資料庫的空間數據均衡分布難題,重點研究適合空間數據特點的並行空間資料庫動態均衡分布方法。 項目主要研究內容包括:(1)顧及空間鄰近性的並行空間資料庫的數據均衡分布理論與方法。(2)並行空間資料庫的數據動態偏斜糾正理論與方法。(3)空間數據動態分布的原型系統和實驗分析。項目取得的主要成果包括: (1)建立了基於空間填充曲線層次分解的由粗到精的空間數據均衡劃分方法,提出了顧及空間鄰近性的數據分布策略。主要思想:基於空間對象之間的Hilbert編碼的鄰近性進行數據劃分,通過初始劃分格網的層次分解實現空間數據劃分均衡,避免過密/過疏劃分造成的系統資源浪費和數據量失衡。對空間數據劃分得到的邏輯數據子集基於Hilbert排列碼分組,使每組內的邏輯數據子集間的鄰近性儘可能小,對邏輯數據子集進行物理聚簇,以提高物理存取效率,然後把物理聚簇的數據子集按邏輯分組採用輪盤法分配到不同的並行節點上,從而確保系統的整體並行度,實現顧及空間鄰近性的數據均衡分布。 (2)建立了基於空間對象最小外接矩形的空間鄰近性度量模型,提出了基於最小空間鄰近度的空間數據偏斜糾正方法。主要思想:儘量將空間範圍鄰近的子集合分布在不同的處理機節點上,使重分布的空間子集合應該與處理機節點上已分布的空間子集合之間具有儘可能小的空間鄰近性。當數據偏斜度超過系統閾值時,通過計算候選子集合與目標處理機節點上已經分布的子集合之間的空間鄰近度,從中選擇空間鄰近度最小的候選子集合遷移到目標處理機節點,以減少動態分布調整操作對系統並行性的影響。 (3)設計實現了空間數據動態分布的原型系統,基於該系統開展了空間數據均衡分布和動態偏斜糾正實驗與分析,取得了較滿意的實驗結果,獲得軟體著作權一項。 本項目綜合考慮空間數據的非結構化變長、非均勻分布和空間關係複雜等特點,空間數據量、空間對象分布、空間鄰近關係等影響空間數據分布平衡的關鍵因素,提出了適合併行空間資料庫動態更新特點的動態數據均衡分布方法,為並行環境下的空間數據分布平衡提供了一種新的有效途徑,為大規模GIS空間數據高性能套用領域提供並行空間資料庫存儲管理技術的重要支撐。

相關詞條

熱門詞條

聯絡我們