《基於正向用戶指導的互動式機器翻譯技術研究》是依託瀋陽航空航天大學,由葉娜擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於正向用戶指導的互動式機器翻譯技術研究
- 項目類別:青年科學基金項目
- 項目負責人:葉娜
- 依託單位:瀋陽航空航天大學
項目摘要,結題摘要,
項目摘要
目前,機器翻譯系統的譯文質量仍然無法滿足實際要求,互動式機器翻譯成為一個重要的研究方向。互動式機器翻譯是一種機器翻譯技術與翻譯人員(用戶)行為相結合的翻譯方式,其中用戶行為是對機器譯文的反饋,可以指導機器翻譯系統產生更準確的譯文,對於提高人機互動的效率有著重要影響。然而,現有互動式機器翻譯方法對於用戶指導的利用還不夠充分、深入。本課題針對指定正確譯文片段(正向)形式的用戶指導,建立互動式機器翻譯模型,從三方面深入挖掘用戶指導的啟發作用:首先,面向基於短語的機器翻譯框架,利用互動式剪枝和預測技術實現多約束條件下的候選路徑搜尋;其次,在傳統的字元層約束匹配過程中加入句法結構和上下文語義限制,進一步提高譯文的準確性;最後,從用戶指導信息中線上學習,結合用戶置信度模型來實時最佳化機器翻譯模型。本課題的研究將為互動式機器翻譯技術提供新的理論基礎和研究思路,促進翻譯生產率的提升。
結題摘要
近年來,隨著機器翻譯技術的快速發展,機器翻譯系統的譯文質量得到了顯著提升。然而,機器譯文仍然不是完全無錯誤的,需要由人類譯員修改後方可使用。互動式機器翻譯技術促進了人機之間的協作,可以提高翻譯生產率。本項目針對互動式機器翻譯技術開展研究,旨在擴展人機互動的途徑和方式,更充分、有效地利用人機互動過程中用戶提供的反饋信息。項目的主要研究結果包括:(1)提出了基於正向多約束的互動式機器翻譯方法,將人機互動的途徑由最長正確前綴的確認擴展為多個正向片段的確認,並對解碼算法進行了四項改進。實驗結果表明,與傳統方法相比,該方法在預測速度可比的前提下獲得了更少的人機互動次數。(2)提出了基於雙語片段的互動式機器翻譯方法,允許譯員從譯項列表中為源語言片段選擇正確譯項,將確認過的雙語片段與前綴一同作為約束參與指導解碼,提高翻譯假設評價和過濾的準確性。根據譯員的翻譯認知過程設計了互動界面,並提出了基於多樣性的譯項重排序算法。人工評測表明,該方法較傳統方法能夠顯著降低認知負擔,提升翻譯效率。(3)提出了基於深層句法和語義約束的互動式機器翻譯方法,將源語言句法結構信息作為隱變數引入互動式機器翻譯框架,從子樹完整性和子樹順序角度判斷前綴與源語言之間能否形成正確的句法對齊關係,並在譯文評價函式中引入前綴和後綴之間的語義關聯度特徵,選擇與前綴具有較高搭配合理性及語義相關性的片段來擴展翻譯假設。實驗結果表明,加入句法和語義約束,能夠顯著降低人機互動次數。(4)提出了從用戶反饋中學習翻譯知識並加以利用的方法,通過建立用戶置信度評價模型,區分不同用戶反饋的翻譯知識,最佳化翻譯模型中短語表的各項參數,並提出了置信度顏色標註、譯文推送等策略,實現人機互動過程中的信息關聯和知識增益。實驗表明,這些方法可以在保證較高翻譯質量的同時,有效地提高翻譯生產率。(5)開展了句對齊等機器翻譯基礎技術和神經機器翻譯技術的研究。