基於短語的統計機器翻譯(phrase-based statistical machine translation)是2018年公布的計算機科學技術名詞。
基本介紹
- 中文名:基於短語的統計機器翻譯
- 外文名:phrase-based statistical machine translation
- 所屬學科:計算機科學技術
- 公布時間:2018年
基於短語的統計機器翻譯(phrase-based statistical machine translation)是2018年公布的計算機科學技術名詞。
基於短語的統計機器翻譯(phrase-based statistical machine translation)是2018年公布的計算機科學技術名詞。定義統計機器翻譯策略之一。翻譯模型中充分考慮了短語及其譯文的統計特性...
統計機器翻譯(英語:c,簡寫為SMT)是機器翻譯的一種,也是非限定領域機器翻譯中性能較佳的一種方法。統計機器翻譯的基本思想是通過對大量的平行語料進行統計分析,構建統計翻譯模型,進而使用此模型進行翻譯。從早期基於詞的機器翻譯已經過渡到基於短語的翻譯,並正在融合句法信息,以進一步提高翻譯的精確性。產品介紹 G...
《基於辭彙語義的統計機器翻譯研究》是依託蘇州大學,由熊德意擔任項目負責人的青年科學基金項目。項目摘要 統計機器翻譯經歷了從基於單詞到基於短語和句法的三個不同階段,目前譯文中仍存在詞不達意,長距離語義約束錯誤翻譯等與語義相關的問題。本項目專注於辭彙語義知識,希望通過系統化地研究基於辭彙語義的統計機器翻譯...
《基於句子語義結構的統計機器翻譯研究》是依託蘇州大學,由李軍輝擔任項目負責人的青年科學基金項目。項目摘要 基於語義的統計機器翻譯(SMT)一直是研究者追求的目標。目前,主流SMT模型(例如短語模型、層次短語模型和樹模型)在翻譯過程中很少利用句子的語義信息。本項目將在前期研究的基礎上,重點研究基於句子語義結構的...
機器翻譯,又稱為自動翻譯,簡稱“機翻、機譯”,是利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程。它是計算語言學的一個分支,是人工智慧的終極目標之一,具有重要的科學研究價值。同時,機器翻譯又具有重要的實用價值。隨著經濟全球化及網際網路的飛速發展,機器翻譯技術在促進政治、經濟...
統計機器翻譯已經從基於詞的模型發展到基於短語和基於傳統句法的模型。雖然基於傳統句法表示的機器翻譯已經受到很多研究者的關注,但是直接沿用單語句法分析中的句法表示形式,並進行相應的建模已經進入了平台期。如何在深度神經網路進行機器翻譯並且在這個過程中融入句法信息是當今自然語言處理領域的主要問題之一。本項目擬...
本課題為解決上述問題,一 方面將統計機器翻譯模型引入信息檢索的查詢擴展,提出把信息檢索的查詢擴展研究中尋找 查詢擴展詞的問題當成是翻譯問題。通過短語到短語的整句翻譯模型,計算短語到短語的翻 譯機率,並以此翻譯機率為基礎計算短語之間的相關度作為依據來進行查詢擴展。另一方面 著重研究把文摘模型融合到檢索模型,...
全書首先簡要介紹語言學和機率論基礎知識,然後全面討論各種經典統計機器翻譯模型和系統實現方法,最後深入探討統計翻譯領域的最新進展和研究熱點。對核心方法的論述按照統計機器翻譯模型發展的過程逐步展開:基於詞的模型、基於短語的模型和基於句法樹的模型。從技術實現的角度,本書還介紹了統計翻譯模型的參數訓練方法、語言...
tree-to-string translation model)是2018年公布的計算機科學技術名詞。定義 一種統計機器翻譯模型。充分考慮了源語言端的句法結構對其正確翻譯的作用,依照樹到串模型,待譯句子通常首先需要進行句法分析,在句法樹的指導下生成候選譯文串,最終經由統計模型選擇最佳譯文。出處 《計算機科學技術名詞 》第三版。
目前的統計機器翻譯系統獲得同步結構通常需要兩個階段:首先從平行語料中獲得詞對齊信息,然後採用一些啟發式規則獲得可能的同步結構。這種相互獨立的分階段模式和啟發式方法缺乏統計理論依據,造成翻譯系統訓練過程和解碼過程的不一致性。本項目以同步短語樹結構的歸約機制研究為切入點,基於貝葉斯理論,探索翻譯系統的統一...
的的機器翻譯模型,以及將該模型在基於短語和基於句法的模型中的集成方法;2、在解碼方面,研究了樹到串句法翻譯規則在層次短語中的有效集成方法;3、在模型訓練方面,研究了基於損失函式強化的句法機器翻譯模型訓練框架;4、在機器翻譯和語言分析支撐平台構建方面,研發了NiuParser系統並升級了NiuTrans開源統計機器翻譯...
《統計機器翻譯領域自適應關鍵技術研究》是依託哈爾濱工業大學,由曹海龍擔任項目負責人的面上項目。項目摘要 如何提高統計機器翻譯系統的領域自適應能力,是一個具有重大實用價值的科學研究問題。本項目針對人類語言的領域多樣性和動態變化等特點,將從三個主要方面對機器翻譯領域自適應問題展開深入研究。第一,從機器翻譯...
力求降低搜尋解碼空間,提高機器譯文輸出質量,為基於句法的統計機器翻譯提供一個新的解決思路。結題摘要 本項目研究了統計機器翻譯的知識獲取與解碼技術。對短語對齊的相關問題進行了探討,設計了短語翻譯對的標註方法。挖掘漢、英語言學之間的對等關係,使用詞形、頻度和長度等屬性來定義雙語評價特徵,包括:短語譯文直譯...
(3)提出了一種基於漢字與音節轉換機率的音譯算法,建立了漢英雙向音譯模型,並將音譯模型和基於短語的統計機器翻譯融合,顯著提高了複雜結構短語和句子的翻譯精度。研究結果表明:功能名詞短語套用到機器翻譯領域,可以消除部分複雜名詞短語的結構歧義,從而達到提高現有機器翻譯系統性能的目的。
主要研究內容包括:改善現有語言分析平台、弱指導的疊代式詞對齊、基於多句法分析器的翻譯規則抽取和融合、目標語樹結構評價、基於實例約束的解碼、篇章級翻譯一致性檢測等技術。最終集成這些關鍵技術,構建串到樹統計機器翻譯開放共享支撐平台。結題摘要 理論上說,句法翻譯模型要比基於詞/短語的模型更有能力處理長距離...
.5 基於短語的機器翻譯16 1 .5.1 對數線性模型17 1 .5.2 基於短語的翻譯模型17 1 .5.3 最小錯誤率訓練19 1 .5.4 搜尋20 1 .5.5 重打分22 1 .5.6 現狀23 1 .6 基於句法的統計機器翻譯23 1 .6.1 無需句法分析的方法24 1 .6.2 目標語言端進行句法分析25 1.6.3 源語言端進行句法分析...
從提升模型容量和語義表達能力的角度對神經機器翻譯系統進行改進;此外通過神經網路結構搜尋的方式對語言建模方式進行探索,有效提升了模型自身的效率以及建模能力;對面向句法/語義機器翻譯的中文句法/語義分析相關問題進行了深入探索,同時研究了統計機器翻譯中源語言結構信息的有效使用問題,提出了基於句法骨架的機器翻譯模型...
《基於短語評價的翻譯知識獲取》介紹了機器翻譯的研究背景、理論基礎和算法描述,並給出了相應的實驗結果。《基於短語評價的翻譯知識獲取》是自然語言處理中翻譯知識獲取方面的專著,反映了作者近年來在這一領域中的主要研究成果。目錄 第1章 概述 1.1 機器翻譯的發展歷程 1.2 語料庫語言學 1.2.1 語料庫 1.2....
1.4.3 約翰?霍普金斯大學(JHU)的統計機器翻譯夏季研討班13 1.4.4 Yamada和Knight的工作——基於句法的統計翻譯模型14 1.4.5 Och等的工作14 1.5 基於對數線性模型的統計機器翻譯方法15 1.5.1 對數線性模型15 1.5.2 基於短語的統計翻譯模型16 1.5.3 基於句法的統計翻譯模型17 1.6 多引擎機器翻譯方法...
多詞表達作為一類由若干辭彙組成的慣用搭配語言單元,對其語義分析及深入研究,是實現語言理解的重要工作,也將推動機器翻譯等套用研究領域的發展。 在本項目中,我們著重對多詞表達的幾種類型進行了研究,包括命名實體,複述短語,網路新詞,和機器翻譯中的集外詞等。主要研究內容包括以下幾個方面:(1)多詞表達...
從三方面深入挖掘用戶指導的啟發作用:首先,面向基於短語的機器翻譯框架,利用互動式剪枝和預測技術實現多約束條件下的候選路徑搜尋;其次,在傳統的字元層約束匹配過程中加入句法結構和上下文語義限制,進一步提高譯文的準確性;最後,從用戶指導信息中線上學習,結合用戶置信度模型來實時最佳化機器翻譯模型。
首先,利用多線上翻譯語詞典系統抽取複述短語的方法的基本思想是將複述短語的抽取看成是基於統計的機器翻譯過程,只是這種機器翻譯是藉助於某種或某些中間語言進行的。我們提出利用中文複述短語的字面相似性特點,將字面相似性融入到複述短語抽取的過程中去。其次,我們還提出了兩種面向長尾查詢改寫的複述資源獲取方法:基於...
第15章統計機器翻譯中的形式模型 15.1 機器翻譯與噪聲信道模型 15.2 最大熵模型 15.3 基於平行機率語法的形式模型 15.4 基於短語的統計機器翻譯 15.5 基於句法的統計機器翻譯 第16章自然語言處理系統的評測 16.1 評測的一般原則和方法 16.2 語音合成和文語轉換系統的評測 16.3 機器翻譯系統的評測 16.4 ...
5.7 機器翻譯 5.7.1 基於詞的統計機器翻譯 5.7.2 基於短語的統計機器翻譯 5.8 語音識別 5.8.1 信號處理 5.8.2 識別 第6章 智慧型信息處理技術 6.1 神經網路 6.1.1 神經網路的模型和學習算法 6.1.2 幾種典型神經網路簡介 6.1.3 神經網路的套用 6.2 深度學習 6.2.1 深度學習...
第16章統計機器翻譯中的形式模型 16.1機器翻譯與噪聲信道模型 16.2最大熵模型 16.3基於平行機率語法的形式模型 16.4基於短語的統計機器翻譯 16.5基於句法的統計機器翻譯 參考文獻 第17章自然語言處理系統的評測 17.1評測的一般原則和方法 17.2語音合成和文語轉換系統的評測 17.3機器翻譯系統的評測 17.4語料...
重點介紹了統計機器翻譯方法,包括基於詞對齊的機器翻譯、基於短語對齊的機器翻譯和基於句法的機器翻譯。詞對齊主要有IBM的詞對齊和基於HMM的詞對齊。短語對齊主要有利用詞對齊進行的短語對齊、對齊模板和層次的對齊短語。基於句法的統計機器翻譯介紹了樹串模型、串樹模型和樹樹模型。目前,基於短語對齊的統計翻譯譯文質量...
863重點項目(與計算所、哈工大、廈門大學、自動化所合作):面向跨語言搜尋的機器翻譯關鍵技術研究 課題摘要:本課題主要以統計機器翻譯方法為關鍵技術來開展跨語言信息檢索的研究。主要研究內容如下:第一,翻譯模型研究:探索辭彙、句法信息及語義信息的結合,研究融入結構知識的翻譯模型;第二,翻譯知識獲取研究:針對...