內容簡介
全面覆蓋了知識圖譜的表示、存儲、獲取、推理、融合、問答和分析等七大方面,100多個基礎知識點的內容
圖書目錄
第1章 知識圖譜概述 1
1.1 語言與知識 2
1.1.1 構建有學識的人工智慧 2
1.1.2 知識的承載與表示方式 3
1.1.3 知識圖譜是一種世界模型 5
1.2 知識圖譜的起源 7
1.2.1 知識圖譜的網際網路基因 7
1.2.2 數據的網際網路—Semantic Web 9
1.2.3 Things, Not Strings 10
1.2.4 典型的知識圖譜項目 10
1.2.5 知識圖譜的概念演進 11
1.3 知識圖譜的價值 12
1.3.1 知識圖譜支持語義搜尋 12
1.3.2 知識圖譜支持智慧型問答 12
1.3.3 知識圖譜支持下的推薦系統 13
1.3.4 知識圖譜輔助語言語義理解 13
1.3.5 知識圖譜擴展視覺理解的深度和廣度 14
1.3.6 知識圖譜輔助IoT設備互聯 14
1.3.7 知識圖譜支持下的大數據分析 15
1.4 知識圖譜的技術內涵 16
1.4.1 知識圖譜是交叉技術領域 16
1.4.2 知識圖譜的兩個核心技術維度 17
1.4.3 知識圖譜的技術棧 17
1.5 建立知識圖譜的系統工程觀 20
第2章 知識圖譜的表示 21
2.1 什麼是知識表示 22
2.1.1 知識表示的五個用途 22
2.1.2 符號表示與向量表示 23
2.2 人工智慧歷史發展長河中的知識表示 24
2.2.1 描述邏輯 25
2.2.2 霍恩規則邏輯 25
2.2.3 產生式系統 26
2.2.4 框架系統 26
2.2.5 語義網路 27
2.3 知識圖譜的符號表示方法 28
2.3.1 基於圖的知識表示方法 28
2.3.2 屬性圖 29
2.3.3 RDF圖模型 30
2.3.4 OWL Web本體語言 31
2.4 知識圖譜的向量表示方法 32
2.4.1 從詞向量講起 33
2.4.2 從詞向量到實體向量 35
2.4.3 知識圖譜向量表示學習模型 35
2.4.4 知識圖譜向量表示的局限性 37
2.5 總結 38
第3章 知識圖譜的存儲與查詢 39
3.1 基於關係型資料庫的知識圖譜存儲 40
3.1.1 圖數據存儲的特點 40
3.1.2 基於三元組表的圖譜存儲 41
3.1.3 基於屬性表的圖譜存儲 41
3.1.4 基於垂直劃分表的知識圖譜存儲 42
3.1.5 基於全索引結構的知識圖譜存儲 43
3.2 基於原生圖資料庫的知識圖譜存儲 44
3.2.1 關係資料庫的局限性 44
3.2.2 原生圖資料庫的優點 47
3.2.3 原生圖資料庫使用舉例 49
3.2.4 什麼時候使用原生圖資料庫 50
3.3 原生圖資料庫實現原理淺析 52
3.3.1 免索引鄰接 52
3.3.2 原生圖資料庫的物理存儲設計 52
3.3.3 節點和關係邊的存儲處理 53
3.3.4 圖遍歷查詢的物理實現 54
3.3.5 屬性數據的物理存儲處理 54
3.3.6 屬性圖與RDF圖存儲的比較 55
3.4 總結 55
第4章 知識圖譜的存儲與查詢 57
4.1 重新理解知識工程與知識獲取 58
4.1.1 知識工程發展歷史簡介 58
4.1.2 知識獲取的瓶頸問題 59
4.1.3 知識圖譜工程 60
4.1.4 知識圖譜與傳統知識工程的差異 61
4.2 實體識別 62
4.2.1 實體識別任務簡介 62
4.2.2 基於HMM的實體識別 63
4.2.3 基於CRF的實體識別 69
4.2.4 基於深度學習的實體識別 70
4.3 關係抽取 71
4.3.1 關係抽取任務定義 71
4.3.2 基於模板的關係抽取 72
4.3.3 基於特徵工程的關係抽取 73
4.3.4 基於核函式的關係抽取 74
4.3.5 基於深度學習模型的關係抽取 75
4.3.6 實體關係聯合抽取 78
4.3.7 基於遠程監督的關係抽取 79
4.3.8 基於Bootstrapping的半監督關係抽取 80
4.4 屬性補全 81
4.5 概念抽取 83
4.5.1 概念圖譜簡介 83
4.5.2 概念抽取的方法 84
4.5.3 概念圖譜的套用場景 86
4.6 事件識別與抽取 87
4.6.1 事件抽取概述 87
4.6.2 事件抽取的方法 88
4.7 知識抽取技術前沿 91
4.7.1 知識抽取發展趨勢 91
4.7.2 少樣本知識抽取 91
4.7.3 零樣本知識抽取 93
4.7.4 終生知識抽取 94
4.8 總結 95
第5章 知識圖譜推理 96
5.1 推理簡述 97
5.1.1 什麼是推理 97
5.1.2 機器推理舉例 99
5.2 知識圖譜推理簡介 101
5.2.1 知識圖譜上的推理實現 101
5.2.2 基於本體公理的知識圖譜推理 103
5.2.3 基於圖結構與規則學習的知識圖譜推理 104
5.2.4 基於表示學習的知識圖譜推理 105
5.2.5 基於圖神經網路的知識圖譜推理 106
5.2.6 符號推理與表示學習的融合 107
5.3 基於符號邏輯的知識圖譜推理 108
5.3.1 基於本體的推理 108
5.3.2 基於Datalog的知識圖譜推理 113
5.3.3 基於產生式規則的推理 114
5.3.4 符號知識圖譜推理總結 117
5.4 基於表示學習的知識圖譜推理 117
5.4.1 利用機器學習實現知識圖譜歸納推理 117
5.4.2 基於嵌入學習的知識圖譜推理 118
5.4.3 基於規則學習的知識圖譜推理 127
5.4.4 本體嵌入 136
5.5 知識圖譜推理總結 144
第6章 知識圖譜融合 146
6.1 知識圖譜融合概述 147
6.1.1 知識異構性 147
6.1.2 知識異構的原因分析 147
6.1.3 不同層次的知識圖譜融合 148
6.2 概念層融合——本體匹配 150
6.2.1 基於術語匹配的本體層融合 151
6.2.2 基於結構特徵的本體層融合 153
6.2.3 基於知識分塊的大規模本體匹配 154
6.3 實例層的融合——實體對齊 155
6.3.1 實體對齊方法概述 155
6.3.2 基於表示學習的實體對齊 156
6.3.3 實體融合工具簡介 158
6.4 知識融合技術前沿 159
6.5 總結 162
第7章 知識圖譜問答 163
7.1 智慧型問答概述 164
7.1.1 智慧型問答系統的發展歷史 164
7.1.2 智慧型問答系統的分類 166
7.1.3 實現知識圖譜問答的主要技術方法 169
7.1.4 知識圖譜問答的主要評測數據集 170
7.2 基於問句模板的知識圖譜問答 172
7.2.1 模板問答概述 172
7.2.2 模板問答實現舉例 173
7.2.3 模板的自動化生成 175
7.3 基於語義解析的知識圖譜問答 178
7.3.1 語義解析問答概述 178
7.3.2 邏輯表達語言 179
7.3.3 語義解析舉例 181
7.3.4 橋接與短語重寫 183
7.3.5 語義解析總結 184
7.4 基於檢索排序的知識圖譜問答 185
7.4.1 檢索排序知識圖譜問答概述 185
7.4.2 實體連結技術 186
7.4.3 檢索排序模型 188
7.5 基於深度學習的知識圖譜問答 188
7.5.1 深度學習在知識圖譜問答中的兩種用法 188
7.5.2 利用深度學習增強語義解析 189
7.5.3 基於端到端神經網路模型的知識圖譜問答 192
7.6 知識圖譜問答總結 195
第8章 圖算法與圖數據分析 196
8.1 圖的基本知識 197
8.1.1 圖與網路科學 197
8.1.2 圖的基本概念 198
8.1.3 圖的基本模型 201
8.2 基礎圖算法 204
8.2.1 圖算法概述 204
8.2.2 路徑與圖搜尋算法 205
8.2.3 中心度算法 207
8.2.4 社區發現算法 209
8.3 圖表示學習與圖神經網路 211
8.3.1 圖表示學習概述 211
8.3.2 隨機遊走序列模型 213
8.3.3 圖神經網路模型 216
8.4 知識圖譜與圖神經網路 224
8.4.1 在知識圖譜表示學習與推理中的套用 224
8.4.2 在知識圖譜構建中的套用 227
8.4.3 知識圖譜+圖神經網路 229
8.5 總結 232
第9章 知識圖譜技術發展 233
9.1 多模態知識圖譜 234
9.1.1 多模態簡介 234
9.1.2 多模態的價值與作用 237
9.1.3 多模態知識圖譜舉例 239
9.1.4 多模態知識圖譜研究 242
9.1.5 多模態知識圖譜總結 247
9.2 知識圖譜與語言預訓練 248
9.2.1 知識圖譜與語言預訓練 248
9.2.2 語言預訓練簡介 248
9.2.3 知識圖譜增強的語言預訓練模型舉例 250
9.2.4 知識驅動的語言預訓練總結 255
9.3 事理知識圖譜 255
9.3.1 事理知識圖譜的定義 256
9.3.2 事理圖譜與知識圖譜 257
9.3.3 事理邏輯關係 258
9.3.4 事理圖譜的套用 260
9.3.5 事理圖譜總結 261
9.4 知識圖譜與低資源學習 261
9.4.1 知識圖譜與低資源學習 261
9.4.2 低資源條件下的知識圖譜構建 263
9.4.3 基於知識圖譜的低資源學習 271
9.4.4 知識圖譜與低資源學習總結 276
9.5 結構化知識預訓練 276
9.5.1 結構化知識預訓練概述 276
9.5.2 知識圖譜結構化上下文 277
9.5.3 知識圖譜靜態預訓練模型 278
9.5.4 知識圖譜動態預訓練模型 283
9.5.5 套用實踐及實驗結果 289
9.5.6 結構化知識預訓練總結 293
9.6 知識圖譜與區塊鏈 293
9.6.1 知識圖譜的價值聯邦 293
9.6.2 聯邦知識圖譜 297
9.6.3 知識圖譜與區塊鏈 297
9.6.4 開放知識圖譜與區塊鏈 299
9.6.5 知識圖譜與區塊鏈總結 300
作者簡介
陳華鈞,浙江大學計算機科學與技術學院教授。主要研究方向為知識圖譜、自然語言處理、大數據系統等。在WWW/IJCAI/AAAI/ACL/VLDB/ICDE, IEEE CIM, IEEE IS, TKDE, Briefings in Bioinformatics 等國際頂級會議或期刊上發表多篇論文。作為負責人主持2項國家自然科學基金重點類項目,以及國家重點研發計畫課題、國家重大科技專項項目及企業合作項目等二十餘項。曾獲國際語義網會議ISWC最佳論文獎(一作)、教育部技術發明一等獎、國家科技進步二等獎、中國中文信息學會錢偉長科技獎一等獎、阿里巴巴優秀學術合作獎、博文視點圖書獎等獎勵。擔任浙江大學阿里巴巴知識引擎聯合實驗室主任、浙江省大數據智慧型計算重點實驗室副主任、中國人工智慧學會知識工程專委會副主任、中國中文信息學會語言與知識計算專委會副主任、全國知識圖譜大會CCKS2020 大會主席、國際語義技術聯合會議JIST2019大會主席、Elsevier Big Data Research Journal Editor in Chief。