《支持摘要搜尋的資料庫多維動態索引技術研究》是依託中國人民大學,由魏哲巍擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:支持摘要搜尋的資料庫多維動態索引技術研究
- 項目類別:青年科學基金項目
- 項目負責人:魏哲巍
- 依託單位:中國人民大學
項目摘要,結題摘要,
項目摘要
隨著網際網路技術的發展和數據收集渠道的多樣化,如何處理和分析隨之產生的海量數據成為當前數據結構研究中的核心關鍵問題之一。目前的資料庫查詢可以大致分為報告查詢(reporting query)與聚合查詢(aggregation query)。前者精確返回所有符合查詢條件的數據,但無法處理海量數據;後者效率較高,但只能返回數據的單個統計量,無法刻畫數據分布。.本項目針對以上資料庫查詢的缺陷,計畫研一類支持摘要查詢的資料庫索引技術。摘要查詢是一類新型資料庫查詢,其目標是在給定查詢條件後,高效率地返回關於所有符合條件的數據的一個摘要,用於刻畫元數據的分布。本項目針對傳統資料庫應對海量數據分析的挑戰,以實現支持摘要搜尋的多維動態資料庫索引作為基本目標,通過對非正交範圍摘要合併技術、非自維護摘要重建算法以及動態誤差參數集成的研究,最終與實際資料庫緊密集成並開發支持摘要搜尋的資料庫原型系統。
結題摘要
針對傳統資料庫查詢的缺陷,項目計畫研究一類支持摘要查詢的資料庫索引技術。摘要查詢是一類新型資料庫查詢,其目標是在給定查詢條件後,高效率地返回關於所有符合條件的數據的一個摘要,用於刻畫元數據的分布。在課題執行過程中,針對對資料庫中近似算法,我們研究了圖資料庫中各類相似度的近似算法,通過採樣等摘要技術,大幅降低了相似度計算的複雜度,為實現百億規模圖上毫秒級相似度查詢提供了理論基礎。對多維度數據數據,本課題研究了高維度數據以矩陣形式存儲時的近似算法,通過矩陣略圖等技術,將高維數據轉化為低維數據,實現了高精度低延時的轉化算法。針對傳統多維度索引樹對摘要查詢的研究,本課題研究了多維度索引樹對於均勻獨立採樣查詢與權重獨立採樣查詢的支持。該類查詢可進一步用於支持任意摘要查詢,是摘要查詢基礎算法的進一步擴展。