《英漢軍事語料句子對齊研究》是2015年6月國防工業出版社出版的圖書,作者是嚴燦勛。
基本介紹
- 書名:英漢軍事語料句子對齊研究
- 作者:嚴燦勛
- ISBN:9787118102833
- 頁數:152頁
- 定價:48元
- 出版社:國防工業出版社
- 出版時間:2015年6月
- 裝幀:平裝
- 開本:32開
內容簡介,圖書目錄,
內容簡介
《英漢軍事語料句子對齊研究》系統闡述了基於雙語詞典的二分圖頂點最大權重配對句子對齊方法,其中包括句子對齊所用的雙語詞典的自建方法、英語句子邊界識別方法、英語單詞形態還原方法及利用雙語詞典對漢語句子進行分詞的方法,解決了普通長度的英漢平行軍事文本的句子對齊問題,對實現其他領域英漢平行語料句子對齊具有借鑑意義。
《英漢軍事語料句子對齊研究》可供自然語言處理領域研究人員、計算語言學研究人員、語料庫建設和套用研究人員、雙語詞典編纂平台設計使用者、機輔翻譯平台設計使用者閱讀參考。
圖書目錄
第1章 平行語料句子對齊方法研究概述
1.1 句子對齊的重要性
1.2 常見的句子對齊方法
1.2.1 基於長度的句子對齊方法
1.2.2 基於辭彙互譯信息的句子對齊方法
1.2.3 長度和辭彙互譯信息混合的句子對齊方法
1.3 二分圖模型在雙語句子對齊中的套用
1.4 小結
第2章 英漢軍事語料句子對齊方法
2.1 句子對齊英漢軍事語料的重要性
2.2 對英漢軍事語料句子對齊方法的思考
2.3 擬採用的句子對齊方法
2.4 小結
第3章 相關語言知識庫的建設
3.1 語言知識庫的建設目的、原始資源及作用
3.1.1 語言知識庫建設目的
3.1.2 語言知識庫原始資源
3.1.3 語言知識庫作用
3.2 相關語言知識庫建設的總體設計
3.2.1 根據句子對齊工作流程確定相關語言知識庫
3.2.2 根據相關語言知識庫架構選擇原始資源
3.3 相關語言知識庫的建設過程
3.3.1 資料庫的選擇
3.3.2 基本數據的準備及相關處理
3.3.3 知識庫的構建
3.4 小結
第4章 文本預處理
4.1 英漢平行文本拆分及段落對齊
4.1.1 英漢平行文本拆分
4.1.2 計算機輔助段落對齊
4.2 英語、漢語句子邊界識別
4.2.1 自主實現英語句子邊界識別的必要性
4.2.2 英語句子邊界識別研究概況
4.2.3 英語句子邊界識別方法設計實現
4.2.4 英語句子邊界識別實驗及結果分析
4.3 英語形態還原
4.3.1 形態還原目的
4.3.2 基於單詞表的形態還原方法
4.3.3 形態變化還原規則
4.3.4 其他詞法現象的處理
4.4 漢語分詞
4.4.1 漢語分詞的目的及基本流程
4.4.2 漢語分詞方法的選擇
4.4.3 基於字元串匹配的分詞方法的掃描方式的選擇
4.4.4 漢語分詞詞典的設計及逆向
最大匹配分詞算法
4.5 小結
第5章 頂點最大權重配對句子對齊算法
5.1 頂點最大權重配對句子對齊處理流程
5.2 句對相關性分值的計算
5.3 雙語句子對齊數學模型
5.3.1 二分圖的定義
5.3.2 二分圖的頂點配對、權重
5.3.3 臨時錨點和二分圖的頂點最大權重配對
5.3.4 頂點最大權重配對與最大權重匹配
5.4 句子對齊的求解要求
5.5 二分圖頂點最大權重配對模型下的句子對齊處理
5.5.1 不需要修正的句子對齊實例
5.5.2 需要修正的句子對齊實例
5.5.3 句子對齊程式對二分圖全局頂點最大權重配對結果的調整
5.6 小結
第6章 英漢句子對齊平台設計實現及實驗
6.1 英漢平行語料句子對齊處理平台的設計和實現
6.1.1 調入英漢平行文本
6.1.2 英漢平行文本段落對齊處理
6.1.3 句子對齊處理
6.1.4 英漢辭彙互譯信息庫管理
6.2 實驗設計和實驗結果分析
6.2.1 實驗設計
6.2.2 句子對齊評價方法
6.2.3 實驗過程及主要數據
6.2.4 錯誤分析及改進措施
6.2.5 實驗及錯誤分析總結
6.3 小結
第7章 總結和展望
7.1 研究取得的主要成果
7.2 展望
參考文獻