《本體匹配中的參數和策略調諧問題研究》是依託東南大學,由汪鵬擔任項目負責人的面上項目。
基本介紹
- 中文名:本體匹配中的參數和策略調諧問題研究
- 項目類別:面上項目
- 項目負責人:汪鵬
- 依託單位:東南大學
中文摘要,結題摘要,
中文摘要
本體匹配調諧是解決本體匹配系統自動參數配置和匹配策略選擇的有效途徑,在提高匹配效果的同時能明顯改善複雜匹配系統對普通用戶的易用性。本項目針對匹配調諧中關鍵問題給出一組解決方案,主要貢獻為:(1)提出匹配需求動態分析和匹配模型靜態分析,前者利用本體特徵和匹配目標動態描述匹配需求,後者利用匹配建模和匹配模組特徵靜態描述匹配系統;(2)提出基於原始碼數據流分析和基於高斯過程變數模型兩種參數相關性分析方法,解決模組內和模組間參數相關性,以及參數與匹配目標相關性分析;(3)提出基於原始碼分析的匹配策略選擇和匹配器組合分析,減少調諧中無關策略數目;(4)提出待匹配本體自動採樣技術和參考匹配結果自動生成技術,為調諧提供本體樣本和參考匹配;(5)提出利用歷史匹配解決相似匹配任務的調諧,對非相似匹配任務則採用群智慧型最佳化方法實現參數調諧,採用機器學習方法實現策略調諧,最後引入用戶反饋進一步提高調諧效果和性能。
結題摘要
本體匹配調諧是解決本體匹配系統自動參數配置和匹配策略選擇的有效途徑, 在提高匹配效果的同時能明顯改善複雜匹配系統對普通用戶的易用性。本項目針對匹配調諧 中關鍵問題給出一組解決方案,主要貢獻為:(1)提出了一種基於本體相似度的本體匹配參數調諧方法,其通過對歷史本體匹配任務進 行搜尋以找出並套用最適合當前本體匹配任務的參數組合而無需依賴參考匹配;同時,通過 相似度預測的方法,實現對於本體匹配歷史記錄的快速搜尋;(2)提出了一種基於 ERT 機器學習模型與本體特徵的本體匹配參數調諧方法,其通過學習歷史匹配任務的特徵與最優參數之間的對應關係並套用於當前本體匹配任務以最佳化其調諧 參數組合而無需依賴參考匹配;(3)設計並實現了模組化的本體匹配參數調諧系統,使用其完成了本文中的實驗;在多個 不同層次的本體匹配調諧系統與權威的 OAEI 數據集上完成了實證檢驗,檢驗本文所提出的 自動調諧方法的有效性與通用性。實驗表明,本課題提出的方法可以在多個不同層次的本體匹配系統與不同種類的本體匹配 數據集上發揮效用,能夠在不給定參考匹配的前提下提升匹配結果的質量,並具有較高的調諧效率。