《基於Markov邏輯網路的限定領域中文自動問答系統研究》是依託復旦大學,由邱錫鵬擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於Markov邏輯網路的限定領域中文自動問答系統研究
- 依託單位:復旦大學
- 項目類別:青年科學基金項目
- 項目負責人:邱錫鵬
項目摘要,結題摘要,
項目摘要
自動問答系統是人工智慧和信息檢索領域熱點研究方向之一。它接受用戶用自然語言提出的問題,然後返回該問題的答案。目前由於開放領域問答系統的研究主要針對單一的、孤立的、基於事實性的問題,並且答案準確率也比較低,對於複雜問題更是難以處理,因此陷入了一定瓶頸。相反在限定領域中,自動問答系統蘊含著巨大的套用價值。由於可以利用領域知識,限定領域自動問答系統可以處理一些複雜問題並提高答案準確率。本課題以限定領域中文自動問答系統作為研究目標,提出以Markov邏輯網路為基礎構建領域知識庫,並且利用Markov邏輯網路的邏輯和機率兩重特徵,很好地將信息抽取、知識庫查詢和答案生成多個環節有機的聯繫到一起來,並構成自動問答系統。本課題的研究可以極大地推動了相關技術(知識庫表示、邏輯推理、信息抽取、句法分析和實體名識別等)的發展,並促進研究與套用的緊密結合。
結題摘要
本項目按照既定的研究計畫,順利開展了研究,完成了預期目標,發表論文19篇,其中在ACL、EMNLP、COLING、ACM TALIP等國際期刊和會議上發表高質量論文8篇。該項目取得的重要成果總結如下: (1)提出了基於Markov邏輯網路的限定領域自動問答系統的基本框架,將問答系統的各個環節(知識表示、問句分析、邏輯轉換、語義推理、答案驗證等)無縫地整合到一個統一的框架中,提高了問答系統的系統性,為深層問答系統奠定了基礎。 (2)提出了一套通過自然語言語理解技術從大規模限定領域數據中抽取專業知識的方法,並構建專業知識庫,將自然語言問句轉換為邏輯表示,通過Markov邏輯網路進行推理並給出答案。該方法有效地整合了各種資源,提高了答案的準確性。 (3)深入研究了目前中文自然語言處理面臨的問題,如中文分詞、詞性標註、實體名識別以及句法分析等,特別是針對問句的分析和處理,提出了多種有效的算法提高中文自然語言處理的性能和效率,並開發了一套開源的中文自然語言處理的工具FudanNLP。 (4)構建了面向音樂和電信領域的問答原型系統,包含自然語言理解、知識表示、推理,問句分析、答案抽取、答案驗證等模組。