海量高維不確定性數據的高效查詢關鍵技術研究

海量高維不確定性數據的高效查詢關鍵技術研究

《海量高維不確定性數據的高效查詢關鍵技術研究》是依託浙江工商大學,由莊毅擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:海量高維不確定性數據的高效查詢關鍵技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:莊毅
  • 依託單位:浙江工商大學
項目摘要,結題摘要,

項目摘要

海量高維不確定性數據管理及查詢技術的研究已成為目前國內外資料庫研究領域的前沿熱點課題,它是資料庫技術、機率及統計理論相結合的交叉研究方向。本項目在申請人前期研究基礎上,借鑑國內外最新相關研究成果,從三方面較系統地研究海量高維不確定性數據的高效機率查詢算法。在單機環境下,針對維數災難及機率查詢的高計算代價的技術挑戰,研究不確定超球最佳化分片及多尺度融合分析的索引方法,提出一種高維不確定數據的複合索引鍵值統一表達方式及高效裁剪(Pruning)策略,並且將其套用於基於闕值的機率k近鄰機率查詢。同時為了進一步提高查詢效率,研究分散式環境下的並行可擴展機率查詢。最後,針對查詢密集的套用,研究分散式多重機率查詢最佳化策略,利用機率論,聚類,並行流水線等技術提高多重機率查詢的整體性能。

結題摘要

海量高維不確定性數據管理及查詢技術的研究已成為目前國內外資料庫研究領域的前沿熱點課題,它是資料庫技術、機率及統計理論相結合的交叉研究方向。本項目在申請人前期研究基礎上,借鑑國內外最新相關研究成果,從三方面較系統地研究海量高維不確定性數據的高效機率查詢算法。在單機環境下,針對維數災難及機率查詢的高計算代價的技術挑戰,研究不確定超球最佳化分片及多尺度融合分析的索引方法,提出一種高維不確定數據的複合索引鍵值統一表達方式及高效裁剪(Pruning)策略,並且將其套用於基於闕值的機率k 近鄰機率查詢。同時為了進一步提高查詢效率,研究分散式環境下的並行可擴展機率查詢。最後,針對查詢密集的套用,研究分散式多重機率查詢最佳化策略,利用機率論,聚類,並行流水線等技術提高多重機率查詢的整體性能。經過三年的實施,本項目共發表學術論文15篇,專著一部,其中,SCI收錄和待收錄總計4篇,EI收錄8篇。

相關詞條

熱門詞條

聯絡我們