專家檢索資源獲取與學習排序方法研究

專家檢索資源獲取與學習排序方法研究

《專家檢索資源獲取與學習排序方法研究》是依託昆明理工大學,由余正濤擔任項目負責人的面上項目。

基本介紹

  • 中文名:專家檢索資源獲取與學習排序方法研究
  • 項目類別:面上項目
  • 項目負責人:余正濤
  • 依託單位:昆明理工大學
項目摘要,結題摘要,

項目摘要

專家檢索關注如何檢索與查詢主題相關的專家。課題將圍繞專家證據文檔識別、專家消歧、專家元數據提取與融合、專家關係網構建、專家排序等專家檢索資源數據獲取與學習排序關鍵問題研究。在專家證據文檔識別方面,結合專家證據內容及關聯關係,構建專家文檔機率圖模型,識別專家證據類別;在專家消歧方面,結合專家屬性與關聯關係,構建基於半監督圖聚類的專家消歧模型;在專家元數據提取與融合方面,融合單證據文檔特徵及證據文檔間關聯特徵,構建專家元數據提取與融合學習模型,提取專家元數據;在專家關係構建方面,藉助監督學習與文檔有監督隱式主題分析模型,從專家證據文檔抽取顯式或隱式主題關係,構造專家主題關係網;在專家排序方面,融合依存語言模型、專家關係、結構屬性等特徵,構建基於列表的專家學習排序模型;在此基礎上,搭建中文專家信息檢索原型系統。課題將解決專家資源獲取、組織及檢索過程的難點問題,有著非常重要的理論和實際套用價值。

結題摘要

專家檢索關注如何檢索與查詢主題相關的專家,是當前研究的熱點問題。項目圍繞專家證據文檔識別、專家消歧、專家元數據提取、專家關係網構建、專家排序等專家檢索關鍵問題進行了研究和探討,在以下幾個方面取得了進展:1.專家證據文檔識別方面,提取專家主頁及中文百科等專家證據文檔獨立頁面特徵及候選專家證據文檔間關聯關係特徵,構建專家證據文檔識別無向圖模型,識別專家文檔類別,為自動獲取專家證據頁面提供了技術支撐;2.專家消歧方面,結合專家屬性與關聯關係,提出融合關聯關係的半監督圖聚類專家消歧方法,以專家屬性關聯關係作為半監督約束關係,構建半監督圖聚類專家消歧模型,實現專家人名消歧,可有效解決專家重名識別問題;3.專家元數據提取方面,針對專家元數據組合複雜、頁面間存在關聯的特點,提出了基於三維模型的專家元數據提取方法,利用頁面上下文特徵構建一維模型提取元數據基本單元,通過二維層疊模型提取出複雜組合實體,利用頁面間關聯特徵構建三維模型提取多頁面專家元數據,可有效實現專家元數據提取;4. 專家關係網構建方面,提出了融合專家主題及關聯特徵的專家關係提取方法,能有效提取專家關係。提出了基於隨機遊走策略的專家關係網路構建方法,利用隨機遊走思想將若干表征專家關係的簡單無向圖進行有機組合,構建複雜專家關係網路;5.專家學習排序方面,提出了基於關聯特徵的專家列表學習排序方法,有效利用專家之間關聯實現專家學習排序;為解決排序函式最佳化問題,提出了基於深度學習的專家排序方法,為解決參數學習中的局部最優問題,結合稀疏學習控制損失函式的稀疏程度,提出了基於稀疏學習的專家列表排序學習方法,有效提升排序的精度;6.在專家推薦方面,提出了基於微博用戶間顯式及微博主題隱式關係的關係網路構建及專家興趣社區發現方法,能有效實現基於社區發現的專家推薦。利用項目主題間及專家間的相關性,提出了基於Markov網路的評審專家推薦及基於主題關係的評審專家協同推薦方法,能有效實現評審專家協同推薦;7.在專家檢索系統方面,設計實現了專家證據文檔識別、中文專家檢索、評審專家推薦及微博數據敏感信息推送等多項系統,表現了好的效果。課題發表論文59篇,其中SCI收錄6篇,EI收錄36篇,國際期刊25篇,登記軟體著作權8項,負責人通過培養入選國家萬人計畫和國家百千萬人才,培養博士研究生1名,培養碩士研究生26名。

相關詞條

熱門詞條

聯絡我們