數據標註工程——語言數據與結構

《數據標註工程——語言數據與結構》是電子工業出版社出版的圖書,作者是饒高琦,王會珍。

基本介紹

  • 中文名:數據標註工程——語言數據與結構 
  • 作者:饒高琦,王會珍
  • 出版時間:2023年8月
  • 出版社:電子工業出版社
  • 頁數:216 頁
  • 字數:220千字
  • ISBN:9787121459542
  • 開本:16 開
內容簡介,圖書目錄,

內容簡介

本書是數據標註領域領先的實訓講義。本書著重對常見的文本、語音和圖像標註任務類型進行介紹,幫助從事標註工作的學習者快速地完成系統化學習,進行標註實戰。 本書對文本、語音及圖像標註的多種任務類型逐一進行講解和分析,每種標註類型均配有對應的規範、舉例分析、習題及解析。同時,本書還針對各類標註配套多種子任務類型或多個領域的實操練習題,以幫助本書學習者增長見識,實現系統的、完整的學習,培養實戰能力。

圖書目錄

第1章 語言和語言數據 001
1.1 自然語言 002
1.1.1 什麼是自然語言 002
1.1.2 世界語言概況 005
1.2 語言智慧型 006
1.2.1 語言智慧型是什麼 006
1.2.2 語言智慧型的常見任務和套用 007
1.3 語言資源 013
1.3.1 什麼是語言資源 013
1.3.2 為什麼語言資源是語言智慧型的基礎 014
1.3.3 語言資源建設概況 015
第2章 語音和語音數據 017
2.1 語音和語音信息處理 018
2.1.1 語音合成 018
2.1.2 語音識別 019
2.2 語音的語言學結構 019
2.2.1 語音的屬性 019
2.2.2 音節和音位 022
2.2.3 輔音和聲母 023
2.2.4 元音和韻母 024
2.3 語音的信息結構 026
2.3.1 時域信息 027
2.3.2 頻域信息 028
第3章 漢字和文字數據 030
3.1 漢字信息處理 031
3.2 漢字的結構 032
3.2.1 漢字的演化 032
3.2.2 漢字的特點 034
3.3 漢字的信息化 036
3.3.1 字元編碼 036
3.3.2 漢字編碼 037
3.3.3 漢字的字元集 039
第4章 詞法和詞義 043
4.1 詞與詞處理 044
4.1.1 分詞 045
4.1.2 命名實體識別 046
4.1.3 詞性標註 047
4.2 辭彙的結構 048
4.2.1 辭彙的結構單元 048
4.2.2 詞語的類型 052
4.2.3 特殊類型的詞 055
4.3 辭彙的語法功能:詞性 061
4.3.1 實詞 062
4.3.2 虛詞 070
4.4 辭彙的語義 075
4.4.1 詞義的構成 075
4.4.2 詞義的聚合關係 080
4.4.3 詞典和詞語的釋義 084
4.5 詞語數據資源 087
4.5.1 漢語詞表資源 087
4.5.2 漢語詞典資源 091
4.5.3 其他重要漢語辭彙語義資源 105
第5章 句法和句義 109
5.1 句與句處理 110
5.1.1 句法分析 110
5.1.2 句義分析 111
5.2 句子的結構 113
5.2.1 句法成分 113
5.2.2 句子的結構類型 118
5.2.3 句子的特殊類型 123
5.2.4 句子的語氣類型 128
5.3 句法信息的表示形式 135
5.3.1 短語結構文法 135
5.3.2 依存文法 139
5.4 句子的語義 141
5.4.1 句子的語義種類 141
5.4.2 句子的語義結構 144
5.4.3 句子中的歧義 149
5.4.4 語義的表現形式:語義角色 153
5.4.5 語義的表現形式:語義依存 155
5.4.6 語義的表現形式:抽象語義表示 156
5.4.7 語義的表現形式:邏輯命題表示 160
5.5 句級數據資源 162
5.5.1 樹庫資源 162
5.5.2 句級語義資源 167
5.5.3 平行語料庫 167
第6章 篇章和篇章信息處理 169
6.1 對篇章的信息處理 169
6.1.1 文本分類 170
6.1.2 自動摘要 170
6.1.3 信息抽取 171
6.2 修辭和語體 171
6.2.1 修辭 171
6.2.2 語體和體裁 183
6.3 修辭結構理論 190
6.3.1 修辭結構理論起源 190
6.3.2 定義關係 191
6.3.3 認知圖式 198
6.4 篇章的數據資源 200
6.4.1 修辭結構篇章樹庫 200
6.4.2 文本分類 201
6.4.3 面向話題指稱結構的語料庫資源 202
6.4.4 篇章意圖資源 203
6.4.5 漢語篇章廣義話題結構資源 203
6.4.6 基於主述位理論的漢語微觀話題語料庫資源 204

相關詞條

熱門詞條

聯絡我們