生成式深度學習

生成式深度學習

《生成式深度學習》是2021年中國電力出版社出版的圖書,作者是[英]大衛·福斯特。

基本介紹

  • 中文名:生成式深度學習
  • 作者:[英]大衛·福斯特
  • 類別:計算機/網路類圖書
  • 出版社:中國電力出版社
  • 出版時間:2021年
  • 開本:16 開
  • 裝幀:平裝-膠訂
  • ISBN:9787519853082
內容簡介,圖書目錄,作者簡介,

內容簡介

學習如何通過變分自動編碼器改變圖像中人物的面部表情。學習如何構建GAN模型,包括風格遷移模型CycleGAN以及音樂生成模型MuseGAN。學習如何通過循環生成模型來生成文本,以及如何利用注意力機制改善模型。學習如何利用生成模型幫助智慧型體在強化學習環境中完成任務。探索Transformer(BERT、GPT-2),以及ProGAN和StyleGAN等圖像生成模型的架構。

圖書目錄

前言 .1
部分 生成式深度學習概述
第1 章 生成建模 11
1.1 什麼是生成建模? 11
1.1.1 生成建模與判別建模 13
1.1.2 機器學習的發展 . 14
1.1.3 生成建模的興起 . 15
1.1.4 生成建模的框架 . 18
1.2 機率生成模型 21
1.2.1 你好,Wrodl ! 24
1.2.2 你的個機率生成模型 . 25
1.2.3 樸素貝葉斯 28
1.2.4 你好,Wrodl !續篇 . 31
1.3 生成建模的難題 33
表示學習 34
1.4 設定環境 37
1.5 小結 40
第2 章 深度學習 41
2.1 結構化與非結構化數據 41
2.2 深度神經網路 43
Keras 和TensorFlow 44
2.3 個深度神經網路 . 45
2.3.1 載入數據. 46
2.3.2 建立模型. 48
2.3.3 編譯模型. 52
2.3.4 訓練模型. 54
2.3.5 評估模型. 55
2.4 改進模型 58
2.4.1 卷積層 . 58
2.4.2 批標準化. 64
2.4.3 Dropout 層 . 66
2.4.4 結合所有層 68
2.5 小結 71
第3 章 變分自動編碼器 73
3.1 畫展 73
3.2 自動編碼器 . 76
3.2.1 個自動編碼器 . 77
3.2.2 編碼器 . 78
3.2.3 解碼器 . 80
3.2.4 連線編碼器與解碼器 82
3.2.5 分析自動編碼器 . 84
3.3 變化後的畫展 87
3.4 構建變分自動編碼器 . 89
3.4.1 編碼器 . 89
3.4.2 損失函式. 94
3.4.3 分析變分自動編碼器 97
3.5 使用VAE 生成面部圖像 98
3.5.1 訓練VAE 99
3.5.2 分析VAE . 102
3.5.3 生成新面孔 . 103
3.5.4 隱空間的算術 104
3.5.5 面部變形 106
3.6 小結 . 107
第4 章 生成對抗網路 108
4.1 神秘獸 108
4.2 生成對抗網路簡介 111
4.3 個生成對抗網路 112
4.3.1 判別器 113
4.3.2 生成器 115
4.3.3 訓練GAN 119
4.4 GAN 面臨的難題 125
4.4.1 損失震盪 125
4.4.2 模式收縮 126
4.4.3 不提供信息的損失函式 126
4.4.4 超參數 127
4.4.5 解決GAN 面臨的難題 . 127
4.5 WGAN 127
4.5.1 Wasserstein 損失 128
4.5.2 利普希茨約束 130
4.5.3 權重裁剪 131
4.5.4 訓練WGAN 132
4.5.5 分析WGAN 133
4.6 WGAN-GP 134
4.6.1 梯度懲罰損失 135
4.6.2 分析WGAN-GP 139
4.7 小結 . 140
第二部分 教機器繪畫、寫作、作曲和玩遊戲
第5 章 繪畫 145
5.1 蘋果和橙子 146
5.2 CycleGAN 149
5.3 個CycleGAN 模型 . 151
5.3.1 簡介 151
5.3.2 生成器(U-Net) 153
5.3.3 判別器 157
5.3.4 編譯CycleGAN 158
5.3.5 訓練CycleGAN 161
5.3.6 分析CycleGAN 162
5.4 創建一個模仿莫奈作品的CycleGAN . 164
5.4.1 生成器(ResNet) 165
5.4.2 分析CycleGAN 166
5.5 神經風格遷移 . 168
5.5.1 內容損失 169
5.5.2 風格損失 172
5.5.3 總方差損失 . 175
5.5.4 運行神經風格遷移 176
5.5.5 分析神經風格遷移模型 177
5.6 小結 . 178
第6 章 寫作 179
6.1 壞傢伙們的文學社 180
6.2 長短期記憶網路 181
6.3 個LSTM 網路 182
6.3.1 分詞 183
6.3.2 建立數據集 . 185
6.3.3 LSTM 架構 . 187
6.3.4 嵌入層 187
6.3.5 LSTM 層 188
6.3.6 LSTM 元胞 . 190
6.4 生成新文本 192
6.5 RNN 擴展 . 196
6.5.1 堆疊式循環網路 196
6.5.2 門控制循環單元 198
6.5.3 雙向元胞 200
6.6 編碼器- 解碼器模型 200
6.7 問答生成器 203
6.7.1 問答數據集 . 204
6.7.2 模型架構 205
6.7.3 推斷 210
6.7.4 模型的結果 . 212
6.8 小結 . 214
第7 章 作曲 215
7.1 前提知識 216
音符 216
7.2 個生成音樂的RNN 219
7.2.1 注意力 220
7.2.2 使用Keras 建立注意力機制 222
7.2.3 分析注意力RNN . 226
7.2.4 編碼器- 解碼器網路中的注意力 . 232
7.2.5 生成複音音樂 236
7.3 MuseGAN . 237
7.4 個MuseGAN . 238
7.5 MuseGAN 生成器 . 241
7.5.1 和弦、風格、旋律和律動 242
7.5.2 小節生成器 . 245
7.5.3 匯總 246
7.6 評論者 248
7.7 分析MuseGAN 249
7.8 小結 . 251
第8 章 玩遊戲 253
8.1 強化學習 254
OpenAI Gym . 256
8.2 世界模型架構 . 257
8.2.1 變分自動編碼器 258
8.2.2 MDN-RNN . 259
8.2.3 控制器 260
8.3 設定 . 261
8.4 訓練過程概述 . 262
8.5 收集隨機rollout 數據 . 263
8.6 訓練VAE 266
8.6.1 VAE 架構 . 268
8.6.2 探索VAE . 270
8.7 收集訓練RNN 的數據 273
8.8 訓練MDN-RNN 274
8.8.1 MDN-RNN 的架構 . 275
8.8.2 從MDN-RNN 中採樣下一個z 和獎勵 . 276
8.8.3 MDN-RNN 的損失函式 277
8.9 訓練控制器 279
8.9.1 控制器的架構 280
8.9.2 CMA-ES 281
8.9.3 並行CMA-ES 283
8.9.4 控制器訓練的輸出結果 285
8.10 在想像環境中訓練 . 286
8.10.1 在想像環境中訓練控制器 . 288
8.10.2 在想像環境中訓練的挑戰. 290
8.11 小結 291
第9 章 生成建模的未來 . 292
9.1 五年的進步 292
9.2 Transformer 294
9.2.1 位置編碼 295
9.2.2 多頭注意力 . 297
9.2.3 解碼器 299
9.2.4 Transformer 的分析 299
9.2.5 BERT . 301
9.2.6 GPT-2 301
9.2.7 MuseNet 302
9.3 圖像生成的進步 303
9.3.1 ProGAN 303
9.3.2 自我注意力GAN(SAGAN) . 305
9.3.3 BigGAN 306
9.3.4 StyleGAN 307
9.4 生成建模的套用 310
9.4.1 AI 藝術 . 311
9.4.2 AI 音樂 . 311
第10 章 總結 . 314
作者介紹 317
封面介紹 317

作者簡介

David Foster是Applied Data Science的聯合創始人,這是一家數據科學諮詢公司,為客戶提供創新的解決方案。他擁有英國劍橋三一學院的數學碩士學位,以及華威大學運籌學碩士學位。

相關詞條

熱門詞條

聯絡我們