面向多層次篇章語義的機器翻譯理論、方法與實現

面向多層次篇章語義的機器翻譯理論、方法與實現

《面向多層次篇章語義的機器翻譯理論、方法與實現》是依託蘇州大學,由張民擔任項目負責人的重點項目。

基本介紹

  • 中文名:面向多層次篇章語義的機器翻譯理論、方法與實現
  • 項目類別:重點項目
  • 項目負責人:張民
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

機器翻譯歷經了從基於詞、短語到句法的三個發展階段。它把翻譯看作是一個從源語言到目標語言的詞、短語和句法結構的轉換過程,而這種轉換過程是以單一句子為單位進行的。因此,跨句子的篇章信息和語言本身多層次語義信息的缺失成為目前機器翻譯發展的主要問題。本項目擬圍繞此問題展開創新性研究:(1)研究面向機器翻譯的多語多層次篇章語義的理論體系和表達方法,進而構建服務於機器翻譯的多層次篇章語義標註的大規模多語對齊語料資源;(2)基於上述理論體系和語料資源,建立面向多層次篇章語義的機器翻譯模型,研究相應的訓練和解碼算法;(3)開發和實現面向多層次篇章語義的機器翻譯平台和漢英雙向機器翻譯系統,並面向學術界共享語料資源和翻譯平台。本項目預期成果對在機器翻譯研究中如何有效地利用多層次篇章語義知識,對推動自然語言處理、計算語言學和中文信息處理等相關學科的研究和發展,具有重要的科學意義和套用價值。

結題摘要

機器翻譯歷經了從基於詞、短語到句法的三個發展階段。它把翻譯看作是一個從源語言到目標語言的詞、短語和句法結構的轉換過程,而這種轉換過程是以單一句子為單位進行的。因此,跨句子的篇章信息和語言本身多層次語義信息的缺失成為目前機器翻譯發展的主要問題。為解決上述問題,項目對基於語義和篇章的機器方法進行了深入研究,提出了基於篇章的神經網路機器翻譯模型,即融合篇章信息的Transformer NMT模型,是學術界最早的篇章Transformer NMT模型,有效提升了篇章機器翻譯的性能;為提升神經機器翻譯系統的模型的語義表達能力,提出了動態多層表示融合的方法對多層神經網路中的信息進行融合,並在此基礎上對深層網路語言建模方法進行研究,從提升模型容量和語義表達能力的角度對神經機器翻譯系統進行改進;此外通過神經網路結構搜尋的方式對語言建模方式進行探索,有效提升了模型自身的效率以及建模能力;對面向句法/語義機器翻譯的中文句法/語義分析相關問題進行了深入探索,同時研究了統計機器翻譯中源語言結構信息的有效使用問題,提出了基於句法骨架的機器翻譯模型。提出和制定了漢語單語和中英文對照的篇章標註體系和規範,並基於此規範,標註了大規模篇章語料。開發了神經機器翻譯平台,並在學術界共享。本項目達到了預期目標,的研究成果對機器翻譯和自然語言處理,具有重要的科學意義和套用價值。

相關詞條

熱門詞條

聯絡我們