基於句子語義結構的統計機器翻譯研究

基於句子語義結構的統計機器翻譯研究

《基於句子語義結構的統計機器翻譯研究》是依託蘇州大學,由李軍輝擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於句子語義結構的統計機器翻譯研究
  • 項目類別:青年科學基金項目
  • 項目負責人:李軍輝
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

基於語義的統計機器翻譯(SMT)一直是研究者追求的目標。目前,主流SMT模型(例如短語模型、層次短語模型和樹模型)在翻譯過程中很少利用句子的語義信息。本項目將在前期研究的基礎上,重點研究基於句子語義結構的SMT技術亟需解決的兩個核心問題:一是分析現在SMT系統在句子的翻譯過程中發生了哪些語義信息的缺失;二是研究如何在SMT系統中有效控制這種缺失。主要研究內容包括:(1)充分發掘能夠提高SMT質量的語義結構信息,設計合理有效的句子級語義控制框架;(2)設計合理的句子級語義結構表示,並探索語義結構的映射,即給定源端語言的語義結構,將其轉換映射為目標語言的語義結構;(3)探索基於語義結構的句子翻譯,即給定了句子源端語義結構及其目標端的映射,如何綜合這些信息到SMT中,也就是說如何用源端和目標端的語義結構來指導現有的SMT技術。

結題摘要

基於語義的機器翻譯一直是研究者追求的目標。目前,主流統計機器翻譯模型(簡稱SMT, 例如短語模型 、層次短語模型和樹模型等)在翻譯過程中很少利用句子的語義信息。本項目將在前期研究的基礎上,一個研究重點是探索基於句子語義的SMT技術,將統計機器翻譯分為兩個過程:語義分析和語言生成。語義分析將翻譯的源語言解析為其在語義上等價的語義表達式,然後語言生成將語義表達式以目標端語言輸出。 本項目的另一個研究重點是探索融入句法的神經機器翻譯(簡稱NMT, 例如序列到序列模型等)研究,通過循環神經網路為每個源端單詞捕獲它的句法表示,提出三種不同的模型將句法表示添加到序列到序列模型中,實現融入句法信息的神經機器翻譯。

相關詞條

熱門詞條

聯絡我們