統計語言建模與中文文本自動校對技術

統計語言建模與中文文本自動校對技術

《統計語言建模與中文文本自動校對技術》是2017年科學出版社出版的圖書,作者是張仰森。

基本介紹

  • 中文名:統計語言建模與中文文本自動校對技術
  • 作者:張仰森
  • 出版社:科學出版社
  • 出版時間:2017年3月
  • ISBN:9787030518552 
內容簡介,圖書目錄,

內容簡介

本書是作者多年來在自然語言處理領域開展對統計語言建模以及中文文本校對技術研究的總結。主要內容包括統計語言建模和中文文本自動校對技術兩部分內容,共12 章。第一部分介紹統計語言模型構建的基本原理與方法,並對模型訓練及評價方法進行研究,提出統計語言模型建模時訓練語料規模的定量化度量方法。第二部分概述中文文本中常見的各種錯誤,並針對這些錯誤類型提出字詞級、句法級和語義級錯誤的自動偵測方法與模型,開創了漢語文本語義錯誤自動偵測的新思路,提出中文文本錯誤的糾錯建議生成與排序模型。最後基於所提出的模型與算法開發“正文通”中文文本校對系統。

圖書目錄

第一章緒論
第二章統計語言模型
第三章漢語統計語言模型的構建
第四章漢語統計語言模型的訓練與評價
第五章文本校對技術的現狀分析
第六章中文文本字詞錯誤自動偵測的模型與算法
第七章中文文本中語法錯誤的自動偵測模型與算法
第八章中文文本中語義錯誤自動偵測的模型與算法
第九章面向專業領域的中文文本錯誤的自動偵測方法
第十章面向政治新聞領域的中文文本校對方法
第十一章中文文本錯誤糾錯建議的自動生成及其排序方法
第十二章面向中文文本的自動校對實驗系統設計與實現
附錄:漢語語料加工詞性標記體系
參考文獻

相關詞條

熱門詞條

聯絡我們