《雲資料庫查詢模式集自動生成與檢索關鍵技術研究》是依託南開大學,由袁曉潔擔任項目負責人的面上項目。
基本介紹
- 中文名:雲資料庫查詢模式集自動生成與檢索關鍵技術研究
- 項目類別:面上項目
- 項目負責人:袁曉潔
- 依託單位:南開大學
中文摘要,結題摘要,
中文摘要
隨著雲計算與資料庫的廣泛套用,越來越多的普通用戶迫切希望直接訪問雲端海量帶有結構信息的數據。然而,現有雲資料庫的查詢方式,制約了普通用戶的需求。如何使普通用戶可以便捷、高效檢索雲資料庫,已成為國內外學術界與企業的研究熱點。本課題採用資料庫與信息檢索相結合的方法,研究如何利用雲資料庫模式,實現普通用戶快速、準確檢索雲資料庫的新方法:擬採用模式圖描述雲資料庫模式,研究雲資料庫的模式圖抽取方法,設計模式圖節點查詢意向度算法;提出基於模式圖的候選查詢模式集自動生成方案;研究用戶通過關鍵字檢索意向查詢模式的方法;分析檢索日誌,改進查詢意向度的計算與查詢模式集的生成與檢索過程。本課題主要攻克雲資料庫模式抽取、查詢模式集自動生成和查詢模式集檢索排序等目前尚未解決的科學問題。本課題研究內容符合資料庫領域最新研究趨勢,有望取得有一定影響力的成果,在雲資料庫關鍵字檢索領域打開新的研究視野。
結題摘要
隨著雲計算與資料庫的廣泛套用,越來越多的普通用戶迫切希望直接訪問雲端海量帶有結構信息的數據。然而,現有雲資料庫的查詢方式單一、學習難度高,嚴重製約了普通用戶對雲端數據的訪問。如何使普通用戶可以便捷、高效檢索雲資料庫,已成為國內外學術界與企業共同的研究熱點。 本課題採用資料庫與信息檢索相結合的方法,借鑑搜尋引擎成功經驗,研究如何利用雲資料庫模式,實現普通用戶快速、準確檢索雲資料庫的新方法:採用模式圖描述雲資料庫模式,研究雲資料庫的模式圖抽取方法,設計模式圖節點查詢意向度算法;提出模式摘要和重疊模式摘要算法;提出基於模式圖的候選查詢模式集自動生成方案;研究用戶通過關鍵字檢索意向查詢模式的方法;分析檢索日誌,改進查詢意向度的計算與查詢模式集的生成與檢索過程。 本課題的研究主要攻克了雲資料庫模式抽取、模式摘要、查詢模式集自動生成和查詢模式集檢索排序等科學問題,主要取得了以下研究成果: 提出了基於MapReduce的分散式主鍵發現算法和基於最近鄰搜尋的外鍵識別算法,實現了雲資料庫模式抽取,算法具有良好的性能和擴展性,為充分理解雲資料庫模式、構建雲資料庫模式圖提供依據,解決了雲資料庫無法提供聚集、連線等查詢的關鍵問題。 提出了一種模式圖中實體、屬性、實體集合的查詢意向度計算方法,該方法能夠作為候選查詢模式計算的理論依據,同時可對複雜模式資料庫模式摘要形成與數據集成提供有力指導,在此基礎上提出一種新的模式摘要生成方法,並首次提出重疊模式摘要及其生成方法。 提出了關係資料庫動態表單查詢方法,以資料庫模式圖和查詢意向度計算結果為基礎,分析用戶的反饋信息,動態地生成滿足用戶偏好查詢表單,為用戶提供更快更準確的資料庫檢索服務,更易滿足用戶需求。 提出了一種基於MapReduce的表單檢索方案,該方案融合了關鍵字檢索和表單查詢技術,使用用戶輸入的關鍵字檢索預先生成的查詢表單,既縮小了候選表單集合的範圍,又有助於準確表達用戶的查詢意圖。該方案支持智慧型手機、平板電腦等移動智慧型終端訪問,用戶可隨時隨地訪問雲端資料庫。 本課題的研究內容符合資料庫與信息檢索領域最新研究趨勢,課題組的研究成果為雲資料庫的數據質量管理,雲資料庫易用性和異構數據查詢提供了新的解決方案和思路;同時,也為其他學科訪問和分析異構數據集提供了解決方案。本課題的研究成果將有力推動資料庫及其相關學科的研究與發展。