面向網路知識服務的中文動態語義分析關鍵技術研究

項目摘要

網路知識服務作為新一代信息檢索技術的發展方向,能夠為用戶提供更加靈活、準確、可信的信息檢索服務，而適度語義知識的引入及準確、規模化的套用，則是其得以實現的前提。但現有的語義知識庫無法根據網際網路上的海量信息來反映詞條當前環境下的語義變化，從而限制了語義知識在信息檢索中的作用。為此，項目在現有語義知識庫的基礎上，以互動式開放語義知識庫構建為起點，通過語義知識庫與大規模網頁信息的交叉與互動分析,建立基於大規模網頁庫的知識驗證和語義動態特性分析方法，進而建立起一個大規模的、具有快速更新與動態適應能力、語義標註較為準確的語義知識庫。並探索將動態語義套用到查詢擴展與檢索算法、網頁自動語義標註方法和檢索結果線上聚類算法。通過上述算法的研究,建立起一個可行的動態網路信息語義計算框架，大大提高檢索的準確率與查全率，為網路知識服務的實現打下堅實基礎，為促進自然語言處理在智慧型信息檢索中的套用做出積極貢獻。

結題摘要

網路知識服務能夠為用戶提供更加靈活、準確、可信的信息檢索服務，語義知識的引入及準確、規模化的套用，是其得以實現的前提。但現有的語義知識庫無法根據網際網路上的海量信息來反映詞條當前環境下的語義變化，從而限制了語義知識在信息檢索中的作用。為此，項目在現有語義知識庫的基礎上，構建互動式開放語義知識庫。項目提出了一種多源語義知識庫融合方法，通過定義統一的“類別-屬性-詞條-屬性值”分層框架，建立“類別-屬性”模板，為多源語義知識庫融合中的知識選擇和知識不一致問題給出了解決方案。同時，為了解決多源語義知識庫融合中的“類別-屬性”模板構建問題，項目提出了一種基於多過濾器驅動的分散度統計百科知識庫類別屬性抽取方法。在面向百科知識庫的類別屬性抽取研究中，為了解決目標類別屬性集合覆蓋廣度存在的不足，挖掘出類別屬性集合中潛在的具有高語義關聯度的屬性，項目還提出了一種基於語義關聯度挖掘的類別屬性抽取方法，基於容錯粗集理論和語義關聯度計算獲取目標類別的廣義近似空間來作為目標類別屬性集合的上近似。在此基礎上，通過語義知識庫與大規模網頁信息的交叉與互動分析,建立基於大規模網頁庫的知識驗證和語義動態特性分析方法，進而建立起一系列大規模的、具有快速更新與動態適應能力、語義標註較為準確的面向網路知識服務的原型系統。這些研究為網路知識服務的最終實現打下堅實基礎，為促進自然語言處理在智慧型信息檢索中的套用做出積極貢獻。項目實施期間，共發表項目資助論文45篇，其中SCI檢索論文11 篇，EI檢索論文24篇;申請2項國家發明專利，其中2項專利已公開；共培養研究生 13人，其中博士生5人，碩士生8人；與IEEE SMC 聯合創辦並連續主辦三屆國際會議 ICMLC-IWWIP；組織並參與ICONIP2011 Special Session；在2012年與中文信息學會聯合舉辦了第九屆中文信息處理青年學者研討會。

面向網路知識服務的中文動態語義分析關鍵技術研究

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條