基於學習排序模型的中文智慧型提問方法研究

基於學習排序模型的中文智慧型提問方法研究

《基於學習排序模型的中文智慧型提問方法研究》是依託西南大學,由劉明擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於學習排序模型的中文智慧型提問方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:劉明
  • 依託單位:西南大學
項目摘要,結題摘要,

項目摘要

隨著提問的重要性在智慧型輔導系統、自然語言問答系統、人機對話系統等套用領域中日益突出,讓機器能夠模擬人類的提問功能也顯得越發迫切。近年來,國內少數學者對漢語事實類問題提問產生方法做了一些試探性研究,但是準確度不高。主要原因是,智慧型提問系統是一個管道模型,其中句法分析錯誤、指代消解以及實體錯誤識別將影響到系統的性能,並且這些錯誤都是很難避免的。本項目提出的排序學習模型將考慮這些錯誤因素,排除掉低質量的問題,從而提高系統的性能。此外,本項目研究基於漢字相似度產生多項選擇題方法。該方法重點研究基於排序學習的漢字相似度計算模型,該模型可以更方便的融合字音、字形以及字義特徵,找出相似度較高的干擾項漢字。最後建立一個面向教學的自主學習的智慧型化網路學習原型系統,以驗證成果的正確性和可行性,為開發新型的智慧型學習環境奠定基礎。

結題摘要

近年來,智慧型提問作為人機互動的前沿技術已成為智慧型輔導系統、自然語言問答系統、人機對話系統之關鍵,讓機器能夠準確理解含義,並以人類的方式進行問題的提出與解答,為用戶提供更加真實的互動體驗,成為該領域的主要發展方向。目前雖然國內少數學者對漢語的文本理解與問題生成也已做了一些試探性研究,但是準確度普遍不高。其原因為智慧型提問系統是一個管道模型,其中句法分析錯誤、指代消解以及實體錯誤識別將影響到系統的性能,並且這些錯誤都是很難避免的。因此,本項目首先從語言學角度制定問題產生規則,然後基於學習排序方法對事實性問題自動生成展開研究,從句子簡化、問句生成和排序三個階段以相關性、正確率和流程性、歧義性等指標作為問題排序標註的依據,從中提取高質量的問題。該方法相較於以往的方法,在事實性問題的生成上獲得了20%以上的效果提升。此外,現有研究大多僅基於文字的字形相似度特徵,並未考慮深層特徵,導致其效果不佳。本項目在字形的基礎上,提出復選題的自動生成方法,基於相似混合策略,以結合字音、語義特徵漢字的相似度學習排序方法,提取干擾項,排除掉低質量的問題。通過實驗比較了混合策略和另外三種常見的問題生成策略(拼寫,語義和語音策略),結果顯示混合策略在問題生成質量上顯著優於其他三種策略,具備最好的套用效果。最後建立一個面向教學的自主學習的智慧型化網路學習原型系統,在一所國小開展了實證研究,以驗證上述各項成果的正確性和可行性,不僅為開發新型的智慧型學習環境奠定了基礎,同時也促進、推動了漢語自然語言處理技術在計算機科學、教育學和認知科學領域的發展。

相關詞條

熱門詞條

聯絡我們