面向語言工程的現代漢語詞類體系與詞性標註研究

面向語言工程的現代漢語詞類體系與詞性標註研究

《面向語言工程的現代漢語詞類體系與詞性標註研究》是一本2022年科學出版社出版的圖書,作者是邢富坤。

基本介紹

  • 中文名:面向語言工程的現代漢語詞類體系與詞性標註研究
  • 作者:邢富坤
  • 出版社:科學出版社
  • 出版時間:2022年3月1日
  • 頁數:224 頁
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787030714954
  • 叢書系列:國家社科基金後期資助項目
內容簡介,圖書目錄,

內容簡介

《面向語言工程的現代漢語詞類體系與詞性標註研究》面向語言工程,對現有漢語詞類體系和詞性標註工作展開調查,梳理總結漢語詞類體系和詞性標註中存在的主要問題,並以英漢語對比為基礎,揭示漢語詞類體系與詞性標註的主要特點,為漢語本體研究和語料庫加工提供參考。《面向語言工程的現代漢語詞類體系與詞性標註研究》還開展了詞性自動標註模型研究,在隱馬爾科夫模型的基礎上,建立了多觀察和多狀態搭接的COV模型,並將該模型運用到詞性標註任務中,獲得了較好的標註效果。

圖書目錄

目錄
第1章 緒論 1
1.1 研究背景 1
1.2 研究目標與內容 4
1.3 本書結構 5
第2章 詞類研究概述 6
2.1 國際上詞類研究概述 6
2.2 漢語詞類研究概述 11
2.3 面向語言信息處理的漢語詞類研究 13
第3章 詞性標註研究概述 16
3.1 詞性標註與語料庫加工 16
3.2 主要的英語語料庫介紹 19
3.3 主要的漢語語料庫介紹 20
3.4 有關漢語詞性標註的評測活動 22
3.5 語言工程中的自動標註方法研究 23
第4章 詞類屬性調查 28
4.1 調查目的及方法 28
4.2 詞類及其兼類的總體分布 30
4.3 主要詞類屬性調查 39
4.4 另類詞分布統計 45
第5章 詞性標註調查 47
5.1 相關術語及定義 47
5.2 語料標註調查的必要性 50
5.3 詞性標註的調查原則 52
5.4 調查目的及方法 58
5.5 標註語料的總體情況 61
5.6實詞兼類調查 62
5.7 虛詞兼類調查 97
5.8語料標註調查結果分析 107
第6章 漢語詞類與詞性標註問題分析 115
6.1漢語詞類體系的分析 115
6.2 漢語詞性標註分析 143
6.3 漢語詞類問題的總結及相關對策 154
第7章 英漢語詞類問題的比較 159
7.1 句法約束與詞類之間的關係比較 159
7.2 詞類屬性與句法實現之間的比較 162
7.3 詞性標註過程的比較 163
7.4 英漢語詞類特點的總結 166
第8章 COV模型與詞性標註 167
8.1 標註模型概述 168
8.2 COV模型的形式化描述及與HMM模型的對比分析 170
8.3 參數估計及稀疏數據處理 173
8.4 算法描述 175
8.5 評價方法 177
8.6 實驗設計及結果分析 177
8.7 COV模型在英文詞性標註中的套用 189
8.8 COV模型討論 191
第9章 漢語詞性標註體系與自動標註錯誤的關係分析 195
9.1 自動標註錯誤原因 195
9.2 兼類詞詞性調查分類 196
9.3 主要評價指標 197
9.4 實驗結果及分析 198
9.5 主要結論和啟示 205
第10章 總結與展望 207
10.1 主要工作 207
10.2 未來展望 208
參考文獻 210
附錄詞性標註調查詞(詞頻)表 216

相關詞條

熱門詞條

聯絡我們