面向真實環境的異構信息互動式問答理論與方法研究

《面向真實環境的異構信息互動式問答理論與方法研究》是依託哈爾濱工業大學,由王曉龍擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向真實環境的異構信息互動式問答理論與方法研究
  • 依託單位:哈爾濱工業大學
  • 項目類別:面上項目
  • 項目負責人:王曉龍
項目摘要,結題摘要,

項目摘要

互動式問答作為新一代信息服務技術越來越受到研究者的廣泛關注,尤其是Siri和Watson等系統的成功為人們展示了自動問答系統的廣闊發展前景。但在面對真實環境時,往往需要充分利用不同形態、不同結構以及不同來源的信息,用戶也會進行多次有關聯的提問來獲得更加準確的結果,在這種情況下,現有互動式問答技術還難以獲得較好套用。為此,本項目提出一種面向真實環境的異構信息互動式問答模型:通過基於上下文語境的問句理解,確保用戶以自然語言方式與系統進行連續的信息交流;建立面向真實環境的自適應模型以滿足多樣化和個性化的信息需求;為擴大解答問題的範圍並提高答案可信度,系統採用整合的海量異構信息作為知識源,並利用多模型融合算法提高關鍵模組對真實問句處理的魯棒性;同時針對互動過程建立客觀、可量化的評測體系。項目的實施將為網路信息處理、人機互動、語義計算、文本聚類與分類等領域的研究與套用起到積極促進作用。

結題摘要

面向真實環境時,問答系統往往需要充分利用不同形態、不同結構以及不同來源的信息,用戶也會進行多次有關聯的提問來獲得更加準確的結果,在這種情況下,現有互動式問答技術還難以獲得較好套用。為此,課題組提出了本項目。項目的主要研究內容及相關成果如下: 1. 基於網際網路的問答語料庫與文本資源構建。課題組在真實的網購環境下,根據買賣雙方交易中產生的聊天記錄,從中提取出高質量問答對,構建了網路購物問答知識語料庫。同時,項目組研究了通過微博構建了百萬級短文本文摘語料庫。 2. 基於異構信息的關係抽取方法研究。課題組提出了兩種基於遠距離監督的關係抽取方法,分別進行了實驗對比和分析,較以往結果均有了明顯的提升,證明了方法的有效性。 3. 基於上下文的問句理解和答案選擇方法研究。課題組面向限定領域的互動式問答系統,提出了基於問題分類的用戶意圖識別模型,對用戶的輸入進行領域分類,從而能夠更準確地理解用戶意圖。與此同時,課題組提出了使用深度循環卷積神經網路的答案選擇模型,該模型充分捕捉到了文本之間的語義關聯以及語義關係。 4. 面向上下文語境的感知方法研究。課題組對中文問答系統中的時間敏感問句進行了研究,設計了針對時間敏感問句的識別方法,使得有關時間敏感問句的檢索結果平均精度得到了較大改善。 5. 基於深度學習的文本語義匹配方法研究。課題組針對基於深度學習的文本處理方法進行了探索,重點研究了基於卷積神經網路的短文本語義匹配方法,學術成果引起了國內外相關學者的廣泛關注。 6. 互動式問答示範系統。課題組設計研發了一款以日常功能性輔助和娛樂聊天類對話為主的智慧型客服機器人,能夠提供日常生活中的便捷問答、金融知識問答、航空自動售票、基於檢索的問答服務等功能。 綜上,本課按照項目計畫的研究方向和內容開展了較為深入的研究工作,共發表了重要國際期刊和會議在內的論文29篇;培養了博士5人,碩士30人;項目按計畫完成。

相關詞條

熱門詞條

聯絡我們