基於查詢日誌的資料庫自動模式匹配技術研究

基於查詢日誌的資料庫自動模式匹配技術研究

《基於查詢日誌的資料庫自動模式匹配技術研究》是依託瀋陽航空航天大學,由丁國輝擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於查詢日誌的資料庫自動模式匹配技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:丁國輝
  • 依託單位:瀋陽航空航天大學
項目摘要,結題摘要,

項目摘要

模式匹配廣泛套用於資料庫相關領域中,例如數據集成、數據空間、數據倉庫等。現存匹配技術主要利用模式自身屬性、數據實例以及模式結構等信息來發現匹配,就提高匹配的準確性而言,這些信息的利用已處於瓶頸階段。同時,當前的數據共享、數據交換等問題也使得模式匹配成為一個研究熱點,因此,模式匹配領域仍然需要大量的研究。本項目將研究基於資料庫查詢日誌的自動模式匹配技術,目前,此方面的研究寥寥無幾。查詢日誌中包含大量的與模式有關的信息,同時日誌中暗含了相似領域內不同套用之間的業務相似性,這些相似性可用來發現模式元素之間的語義對應關係。具體研究內容如下:1) 日誌中相似性特徵的抽取方法;2) 相似性特徵的表達模型;3) 候選匹配的評價技術;4) 最優匹配的搜尋技術。同時,構建一個模式匹配原型系統來驗證研究成果的正確性和有效性。相關研究成果將有助於提高模式匹配結果的質量,具有重要的理論意義和潛在的套用價值。

結題摘要

大部分數據管理套用的本質問題都是模式匹配,這些數據管理往往需要在多個數據源之間進行數據共享和數據交換。近些年,各行各業積攢的大量的信息形成了一種數據無處不在的情況,這種情況促使了模式匹配的需求快速地增長。網際網路用戶希望他們能夠通過統一的、一致的界面就可以獲得對其有價值的信息,而不是重複地、一次又一次地訪問一些相似的網站。模式匹配正是解決這一問題的有效手段,給定源模式和目標模式,模式匹配的任務是發現兩個模式元素之間的語義對應關係。現存匹配技術主要利用模式自身屬性、數據實例以及模式結構等信息來發現匹配,就提高匹配的準確性而言,這些信息的利用已處於瓶頸階段。查詢日誌中包含大量的與模式有關的信息,同時日誌中暗含了相似領域內不同套用之間的業務相似性,這些相似性可用來發現模式元素之間的語義對應關係。因此,本課題主要研究了基於資料庫查詢日誌的自動模式匹配技術。具體研究的內容包括:查詢日誌分析與處理;相似性特徵的表達模型;基於相似性特徵的子句評價技術;候選匹配的評價技術;最優匹配的搜尋技術。通過分析查詢日誌,得出查詢頻率、查詢子句作用、查詢子句間關係、查詢子句本身內容等可以用於發現模式匹配的相似性。提出了EAV數據模型和關聯圖模型用於表達相似性。提出了基於對象屬性相似性分值和基於結構相似性分值的相似性特徵子句評價技術。針對候選匹配評價,提出了基於序列中屬性的順序和屬性序列相似性分解的匹配評價技術。本課題針對模式匹配問題提出了一系列基於查詢日誌的模式匹配技術,在查詢日誌可用的情況下,這些技術可以單獨用於提高模式匹配的精度,也可以輔助其他主流的模式匹配技術進而提高模式匹配的精度。

相關詞條

熱門詞條

聯絡我們