漢英雙語依存句法分析模型和算法研究

漢英雙語依存句法分析模型和算法研究

《漢英雙語依存句法分析模型和算法研究》是依託蘇州大學,由陳文亮擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:漢英雙語依存句法分析模型和算法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:陳文亮
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

依存句法分析是自然語言處理的一個核心研究問題。已有研究主要基於單語文本,即輸入單語句子,輸出對應的依存樹。由於大規模雙語對齊文本的出現和依存句法驅動的統計機器翻譯的套用需求,最近幾年雙語依存句法分析日益受到重視。本項目重點研究基於漢英雙語對齊文本的依存句法分析,即漢英雙語依存句法分析。主要研究內容包括:(1)研究有指導的雙語依存句法分析模型定義、解碼算法和特徵表示;(2)研究基於大規模語料的特徵表示和特徵的領域自適應問題;(3)探索雙語依存句法分析和統計機器翻譯的互動學習機制;(4)集成上述研究成果,構造一個統一的基於圖模型的漢英雙語依存句法分析平台。當前漢英雙語依存句法分析研究還處於起步階段,本項目的開展將為漢語句法分析技術和機器翻譯研究作出重要貢獻,具有重要的研究價值和套用價值。

結題摘要

依存結構句法分析是對句子進行結構分析,以得到句子中詞與詞之間依賴關係的處理過程。作為自然語言處理和中文信息處理領域的核心研究課題之一,依存句法分析已經被廣泛套用於其它自然語言處理任務中。已有研究主要基於單語文本,即輸入單語句子,輸出對應的依存樹。由於大規模雙語對齊文本的出現和依存句法驅動的統計機器翻譯的套用需求,最近幾年雙語依存句法分析日益受到重視。本項目重點研究基於漢英雙語對齊文本的依存句法分析,即漢英雙語依存句法分析。項目開展三年來,課題組主要在如下方面進行探索研究:(1)提出新的句法分析模型,並研究詞性標註和句法分析的聯合模型;(2)利用大規模語料提出基於依存語言模型的特徵表示和特徵自動變換方法;(3)探索中英文之間約束,研究自動語法推導和句法映射;(4)研究如何與後續套用之間的互動。主要成果如下:(1)出版英文專著一本;(2)發表12篇論文,其中領域內頂級會議論文6篇、IEEE期刊論文4篇;(3)兩次國際重要會議講習報告(Tutorial);(4)申請專利3項;(5)培養4名碩士生和1名博士生;(6)實現一個漢英雙語依存分析平台。

相關詞條

熱門詞條

聯絡我們