基於深度學習的機器閱讀理解

基於深度學習的機器閱讀理解

《基於深度學習的機器閱讀理解》是2021年科學出版社出版的圖書。

基本介紹

  • 中文名:基於深度學習的機器閱讀理解
  • 作者:張鑫,樊靜
  • 出版時間:2021年
  • 出版社:科學出版社
  • ISBN:9787030701008
  • 類別:人工智慧理論與分析
  • 開本:16 開
  • 裝幀:平裝
內容簡介,圖書目錄,

內容簡介

《基於深度學習的機器閱讀理解》介紹了基於深度學習的機器閱讀理解技術,內容涵蓋:任務定義與分類、發展歷程、模型評測和典型套用;多層感知機、表示學習、卷積網路、循環網路、注意力機制等深度學習基礎;基於深度學習的機器閱讀理解技術的共性框架;指針網路等代表性模型,以及它們與共性框架的對應關係;本領域的新動向、新趨勢,及尚待解決的開放性問題。後,附錄中簡介了機器學習和文本分析基礎,引入經典機器閱讀理解技術,並匯總了《基於深度學習的機器閱讀理解》涉及的英文簡稱和網際網路上公開可用的模型算法源碼。

圖書目錄

目錄
前言
第1章 概論 1
1.1 任務簡述 1
1.2 發展歷程 3
1.2.1 早期 3
1.2.2 近期 4
1.2.3當代 5
1.3 任務定義及分類 6
1.3.1 形式化定義 6
1.3.2 任務分類 6
1.3.3 相關任務辨析 11
1.4 模型評測 12
1.4.1 評價指標 12
1.4.2 代表性數據集 16
1.5 典型套用 25
1.5.1 搜尋引擎增強 25
1.5.2 智慧型助理 27
1.6 本章小結 27
第2章 深度學習基礎 28
2.1 多層感知機 28
2.1.1 感知機 28
2.1.2 多層感知機 34
2.1.3 分析總結 39
2.2 表示學習初探 44
2.2.1 文本的稀疏表示 44
2.2.2 文本的分散式表示 45
2.2.3 分析總結 50
2.3 卷積神經網路 51
2.4 循環神經網路及其改進 53
2.5 注意力機制 57
2.6 再論表示學習 59
2.6.1 CoVe 59
2.6.2 ELMo 60
2.6.3 GPT 62
2.6.4 BERT 64
2.7 本章小結 66
第3章 基本框架 67
3.1 基本框架 67
3.2 嵌入編碼 69
3.2.1 傳統編碼方法 70
3.2.2 預訓練的基於上下文的編碼方法 70
3.2.3 多粒度編碼 72
3.3 特徵提取 73
3.3.1 基於循環神經網路的特徵提取 73
3.3.2 基於卷積神經網路的特徵提取 75
3.3.3 基於多頭自注意力的特徵提取 76
3.4 文章-問題互動 76
3.4.1 單向注意力 76
3.4.2 雙向注意力 77
3.4.3 一次互動 79
3.4.4 多次互動 79
3.5 答案預測 81
3.5.1 答案在文章 中 81
3.5.2 答案不在文章 中 83
3.6 其他方法 84
3.6.1 強化學習 84
3.6.2 答案排序 85
3.6.3 句子選擇 85
3.7 本章小結 85
第4章 代表性模型 86
4.1 Match-LSTM:基於指針網路的邊界模型 86
4.2 R-NET:自注意力門控機制 88
4.3 Bi-DAF:雙向注意力流 90
4.4 QANet:基於Transformer結構的閱讀理解模型 92
4.5 R.M-Reader 94
4.6 S-Net 97
4.7 基於雙向自注意力的預訓練語言模型 100
4.8 代表性方法比較分析 100
4.9 本章小結 101
第5章 新興趨勢 103
5.1 引入知識的機器閱讀理解 103
5.1.1 任務定義 103
5.1.2 代表數據集 103
5.1.3 存在的挑戰 104
5.1.4 現有方法 104
5.2 帶有不能回答問題的機器閱讀理解 105
5.2.1 任務定義 105
5.2.2 代表數據集 106
5.2.3 存在的挑戰 106
5.2.4 現有方法 106
5.3 多文檔機器閱讀理解 107
5.3.1 任務定義 107
5.3.2 代表數據集 108
5.3.3 存在的挑戰 108
5.3.4 現有方法 109
5.4 對話式機器閱讀理解 111
5.4.1 任務定義 111
5.4.2 代表數據集 111
5.4.3 存在的挑戰 112
5.4.4 現有方法 113
5.5 跨語言機器閱讀理解 114
5.5.1 任務定義 114
5.5.2 代表數據集 114
5.5.3 存在的挑戰 115
5.5.4 現有方法 116
5.6 推理機器閱讀理解 116
5.6.1 任務定義 116
5.6.2 代表數據集 117
5.6.3 存在的挑戰 118
5.6.4 現有方法 119
5.7 本章小結 119
第6章 開放性問題 120
6.1 開放性問題 120
6.1.1 相關文章的快速檢索獲取 120
6.1.2 機器閱讀理解系統的魯棒性 121
6.1.3 缺乏對外部知識的運用 121
6.1.4 缺乏推理的能力 122
6.1.5 缺乏可解釋性 122
6.2 全書總結 122
附錄一 機器學習基礎概念 124
附錄二 文本分析基礎 132
附錄三 傳統機器閱讀理解概述 139
附錄四 簡稱一覽表 147
附錄五 可用代碼資源 149
參考文獻 150
check!

熱門詞條

聯絡我們