《數據標註工程——語言知識與套用》是電子工業出版社出版的圖書,作者是於東,王會珍。
基本介紹
- 中文名:數據標註工程——語言知識與套用
- 作者:於東,王會珍
- 出版時間:2023年8月
- 出版社:電子工業出版社
- 頁數:140 頁
- 字數:142千字
- ISBN:9787121459559
- 開本:16 開
內容簡介,圖書目錄,
內容簡介
本書介紹了人工智慧與語言知識的結合特點。通過理論概念講解、具體實例分析,介紹語言知識的構建方法、類型案例、套用領域,輔助學習者快速了解行業基礎和發展動態。本書首先介紹語言知識庫的基本理論和構建方法,通過例子介紹資源類語言知識、語料庫語言知識的概念和結構。為了方便理解,本書結合大量案例介紹語言知識在自然語言處理及在司法、醫療、金融等垂直領域中的套用,目的是幫助數據標註者理解行業發展,建立語言知識理論和套用的基本框架,為從事相關工作提供便利。
圖書目錄
第1章 人工智慧與知識表示 001
1.1 智慧型與人工智慧 001
1.1.1 智慧型 001
1.1.2 人工智慧 002
1.2 基本方法和流派 003
1.2.1 基本方法 004
1.2.2 基本流派 004
1.3 知識表示 005
1.3.1 知識符號化 005
1.3.2 知識表示的概念 006
1.3.3 人工智慧中的知識表示 007
1.4 一階謂詞邏輯的知識表示 008
1.4.1 命題邏輯 008
1.4.2 謂詞邏輯 010
1.4.3 使用謂詞表示知識 012
1.4.4 小結 014
1.5 產生式知識表示 015
1.5.1 產生式的概念 015
1.5.2 規則性知識的產生式 015
1.5.3 事實性知識的產生式 017
1.5.4 產生式系統 017
第2章 語言知識庫的構建 023
2.1 語言知識的概念 023
2.1.1 語言知識 023
2.1.2 語言知識庫 024
2.1.3 語言知識庫的類型 025
2.2 語言知識的來源 026
2.2.1 結構化數據 027
2.2.2 半結構化數據 027
2.2.3 非結構化數據 028
2.3 語言知識庫的構建 028
2.3.1 構建流程 028
2.3.2 規範和原則 029
2.4 語言知識獲取方法 031
2.4.1 人工標註知識 031
2.4.2 自動獲取知識 032
2.4.3 人機互動獲取知識 033
2.5 語言知識的存儲 033
2.5.1 資料庫及其類型 033
2.5.2 可擴展標記語言 034
2.5.3 數據交換格式 036
2.5.4 本體知識表示 037
第3章 資源類語言知識 042
3.1 資源類語言知識的概念 042
3.2 資源類語言知識的發展 043
3.2.1 語義網路 043
3.2.2 語義Web 044
3.2.3 知識圖譜 049
3.3 常用的資源類語言知識 049
3.3.1 WordNet 049
3.3.2 FrameNet 050
3.3.3 ConceptNet 052
3.3.4 HowNet 054
3.3.5 同義詞詞林 055
第4章 語料庫語言知識 059
4.1 辭彙中的語言知識 059
4.1.1 詞性知識 059
4.1.2 分詞知識 061
4.2 句子中的語言知識 062
4.2.1 命名實體知識 063
4.2.2 實體關係知識 063
4.2.3 事件知識 064
4.3 句子結構中的知識 065
4.3.1 句法結構樹 065
4.3.2 淺層句法結構 066
4.3.3 依存句法樹 067
4.3.4 抽象語義表示 069
4.4 常用漢語語料庫 070
4.4.1 大規模漢語語料庫 070
4.4.2 漢語標註語料庫 072
第5章 語言知識的套用:面向自然語言處理 077
5.1 自然語言處理的基本問題 077
5.1.1 語言模型問題 077
5.1.2 分類問題 080
5.1.3 序列標註問題 081
5.1.4 語言結構分析問題 083
5.1.5 語言生成問題 085
5.2 自動問答 085
5.2.1 概念和歷史 085
5.2.2 開放領域自動問答 087
5.2.3 基於知識的自動問答 088
5.3 機器閱讀理解 090
5.3.1 概念和發展史 090
5.3.2 完型填空型任務和數據集 092
5.3.3 選擇型任務和數據集 093
5.3.4 片段抽取型任務和數據集 094
5.3.5 自由問答型任務和數據集 095
5.4 機器翻譯 096
5.4.1 概念和發展史 096
5.4.2 機器翻譯的基石:雙語平行語料庫 098
5.4.3 統計機器翻譯方法簡介 099
5.4.4 神經機器翻譯方法簡介 100
第6章 語言知識的套用:面向垂直領域 104
6.1 智慧型司法信息處理 104
6.1.1 概述 104
6.1.2 法律判決預測任務 106
6.1.3 相似案件匹配任務 107
6.1.4 司法領域自動問答 108
6.2 智慧型醫療信息處理 110
6.2.1 概述 110
6.2.2 醫療信息知識庫構建 111
6.2.3 智慧醫療的典型套用 115
6.2.4 智慧醫療的未來發展 116
6.3 智慧型金融信息處理 117
6.3.1 概述 117
6.3.2 金融領域知識庫構建與分析技術 118
6.3.3 智慧型金融的典型套用 123