實用卷積神經網路:運用Python實現高級深度學習模型

實用卷積神經網路:運用Python實現高級深度學習模型

《實用卷積神經網路:運用Python實現高級深度學習模型》是2019年機械工業出版社出版的圖書,作者是莫希特·賽瓦克(Mohit Sewak)[印度]。

基本介紹

  • 中文名:實用卷積神經網路:運用Python實現高級深度學習模型
  • 作者:莫希特·賽瓦克(Mohit Sewak)
  • 出版社:機械工業出版社
  • 出版時間:2019年5月1日
  • 定價:69 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787111621966
內容簡介,圖書目錄,作者簡介,

內容簡介

第1章對深度神經網路遙艱煮榆的科學原理和實現這種網路的不同框架以及框架背後的數學機制提供一個快速回顧。
第2章向讀者介紹卷積神經網路,並展示如何利用深度學習從圖像中提取信息。
第3章從零開始針對圖像分類問題構建一個簡單的CNN,並闡明如何調整參數、最佳化訓練時間以及CNN的性能,以分別提高效率和準確率。
第4章介紹幾種經典的(在競賽中勝出的)CNN架構的優勢和運作機制,以及它們之間的差異和如何使用這些架構。
第5章講授如何使用預先訓練好的網路,並使其適用於新的且不同的數據集。在實際套用中也有一種自定義分類問題,它使用的技術稱為轉移學習。
第6章介紹一種稱為自編碼器的無監督學習技術,同時介紹了CNN自編碼器的不同套用,比如圖像壓縮。
第7章講授目標檢測、實例分割和圖像分類的區別。然後介紹多種使用CNN進行目標檢測和實例分割的技術。
第8章探究生成式CNN網路,然後將其與我們學習得到的有識別力的CNN網路相結合,用CNN/GAN創造新的圖像。
第9章講授深度學習中注意力背後的思想,並學習如何使用基於注意力的模型來實現一些高級解決方案(圖像捕捉和RAM)。我們還將了解不同類型的注意力以及強化學習在硬注意力機制中的作用。

圖書目錄

前言
關於作者
關於審閱者
第1章 深度神經網路概述 1
1.1 創建神經網路塊 1
1.2 TensorFlow介紹 3
1.3 MNIST數據集介紹 10
1.4 Keras深度學習庫概述 14
1.5 基於Keras和MNIST的手寫數字識別 15
1.5.1 訓練和測試數據的檢索 17
1.5.2 訓練數據的可視化 18
1.5.3 創建神經網路 18
1.5.4 訓練神經網路 19
1.5.5 測試 19
1.6 理解反向傳播 20
1.7 本章小結 23
第2章 卷積神經網路介紹 25
2.1 CNN歷史 25
2.2 卷積神經網路 27
2.2.1 計算機如何解釋圖像 28
2.2.2 編碼實現圖像可視化 29
2.2.3 dropout 31
2.2.4 輸入層 31
2.2.5 卷積層 32
2.2.6 池化層 34
2.3 實踐示例:圖像分類 35
2.4 本章小結 39
第3章 構建CNN並進行性能最佳化 41
3.1 CNN架構和DNN的缺點 41
3.1.1 卷積操作 44
3.1.2 池化、步長和填充操作 46
3.2 TensorFlow中的卷積和池化操作 48
3.2.1 在TensorFlow中套用池化操作 49
3.2.2 TensorFlow中的卷積操作 51
3.3 訓練CNN 53
3.3.1 初始化權重和偏置 53
3.3.2 正則化 54
3.3.3 激活函式 54
3.4 創建、訓練和評估第一個CNN 56
3.5 模型性能最佳化 73
3.5.1 隱含層數量 73
3.5.2 每個隱含層的神經元個數 74
3.5.3 批標準化 74
3.5.4 高級正則化及過擬合的避免 76
3.5.5 運用哪個最佳化提籃器 79
3.5.6 記憶體調優 79
3.5.7 層的位置調優 80
3.5.8 綜合所有操作創建第二個CNN 80
3.5.9 數據集描述和預處理 80
3.5.10 創建CNN模型 85
3.5.11 訓練和評估網路 87
3.6 本章小結 90
第4章 經典的CNN模型架構 91
4.1 ImageNet介紹 91
4.2 LeNet 92
4.3 AlexNet架構 93
4.4 VGGNet架構 95
4.5 GoogLeNet架構 97
4.5.1 架構洞察 98
4.5.2 inception模組 99
4.6 ResNet架構 99
4.7 本章小結 101
第5章 轉移學習 103
5.1 特徵主屑盼提取方法 103
5.1.1 目標數據集較小且與原始訓練集相似 104
5.1.2 目標數據集較小且與原始訓練集不同 105
5.1.3 目標數據集很大且與原始訓練集相似 107
5.1.4 目標數據集很大且與原始訓練集不同 107
5.2 轉移學習示例 108
5.3 巴榆主多任務學習 111
5.4 本章小結 111
第6章 CNN自編碼器 113
6.1 自編碼器介紹 113
6.2 卷積自編碼器 114
6.3 套用 115
6.4 本章小結 116
第7章 CNN目標檢測與實例分割 119
7.1 目標檢測與圖像分類的區別 120
7.2 傳統的、非CNN的遷槓催目標檢道寒全主測方法 124
7.3 R-CNN:CNN特徵區 128
7.4 承只棕Fast R-CNN:基於區域快速識別的CNN 130
7.5 Faster R-CNN:基於快速區域生成網路的CNN 132
7.6 Mask R-CNN:CNN實例分割 135
7.7 實例分割的代碼實現 137
7.7.1 創建環境 138
7.7.2 準備COCO數據集資料夾結構 139
7.7.3 在COCO數據集上運行預訓練模型 139
7.8 參考文獻 139
7.9 本章小結 141
第8章 GAN:使用CNN生成新圖像 143
8.1 Pix2pix:基於GAN的圖像翻譯 144
8.1.1 CycleGAN 144
8.1.2 訓練GAN模型 145
8.2 GAN的代碼示例 146
8.2.1 計算損失 149
8.2.2 半監督學習和GAN 151
8.3 特徵匹配 152
8.3.1 基於半監督分類的GAN示例 152
8.3.2 深度卷積GAN 158
8.4 本章小結 159
第9章 CNN和視覺模型的注意力機制 161
9.1 圖像描述中的注意力機制 164
9.2 注意力類型 168
9.2.1 硬注意力 168
9.2.2 軟注意力 169
9.3 運用注意力改善視覺模型 170
9.3.1 視覺CNN模型次優性能的原因 171
9.3.2 循環視覺注意力模型 174
9.4 參考文獻 180
9.5 本章小結 181

作者簡介

Mohit Sewak是IBM的高級認知數據科學家,也是比爾拉技術與科學學院的人工智慧和計算機科學博士。他在人工智慧、深度學習和機器學習方面擁有多項專利和著作。他曾是一些非常成功的人工智慧/機器學習軟體和行業解決方案的首席數據科學家,並在早期就參與了沃森認知商業產品線的解決方案研究。他在TensorFlow、Torch、Caffe、Theano、Keras、Watson等架構的設計和解決方案方面有14年的豐富經驗。
Md. Rezaul Karim是德國Fraunhofer FIT的研究科學家。他也是德國亞琛工業大學的博士研究生。在加入FIT之前,他曾在愛爾蘭的Insight數據分析中心擔任研究員。他也曾是韓國三星電子的首席工程師。
他在C++、Java、R、Scala和Python方面有9年的研發經驗,也在生物信息學、大數據和深度學習方面發表過研究論文。此外在Spark、Zeppelin、Hadoop、Keras、Scikit-Learn、TensorFlow、Deeplearning4j、MXNet、H2O等方面都有實際的工作經驗。
Pradeep Pujari是沃爾瑪實驗室的機器學習工程師,也是ACM的傑出成員。他的核心專業領域是信息檢索、機器學習和自然語言處理。在空閒的時候,他喜歡研究人工智慧技術、閱讀和輔導。
3.2 TensorFlow中的卷積和池化操作 48
3.2.1 在TensorFlow中套用池化操作 49
3.2.2 TensorFlow中的卷積操作 51
3.3 訓練CNN 53
3.3.1 初始化權重和偏置 53
3.3.2 正則化 54
3.3.3 激活函式 54
3.4 創建、訓練和評估第一個CNN 56
3.5 模型性能最佳化 73
3.5.1 隱含層數量 73
3.5.2 每個隱含層的神經元個數 74
3.5.3 批標準化 74
3.5.4 高級正則化及過擬合的避免 76
3.5.5 運用哪個最佳化器 79
3.5.6 記憶體調優 79
3.5.7 層的位置調優 80
3.5.8 綜合所有操作創建第二個CNN 80
3.5.9 數據集描述和預處理 80
3.5.10 創建CNN模型 85
3.5.11 訓練和評估網路 87
3.6 本章小結 90
第4章 經典的CNN模型架構 91
4.1 ImageNet介紹 91
4.2 LeNet 92
4.3 AlexNet架構 93
4.4 VGGNet架構 95
4.5 GoogLeNet架構 97
4.5.1 架構洞察 98
4.5.2 inception模組 99
4.6 ResNet架構 99
4.7 本章小結 101
第5章 轉移學習 103
5.1 特徵提取方法 103
5.1.1 目標數據集較小且與原始訓練集相似 104
5.1.2 目標數據集較小且與原始訓練集不同 105
5.1.3 目標數據集很大且與原始訓練集相似 107
5.1.4 目標數據集很大且與原始訓練集不同 107
5.2 轉移學習示例 108
5.3 多任務學習 111
5.4 本章小結 111
第6章 CNN自編碼器 113
6.1 自編碼器介紹 113
6.2 卷積自編碼器 114
6.3 套用 115
6.4 本章小結 116
第7章 CNN目標檢測與實例分割 119
7.1 目標檢測與圖像分類的區別 120
7.2 傳統的、非CNN的目標檢測方法 124
7.3 R-CNN:CNN特徵區 128
7.4 Fast R-CNN:基於區域快速識別的CNN 130
7.5 Faster R-CNN:基於快速區域生成網路的CNN 132
7.6 Mask R-CNN:CNN實例分割 135
7.7 實例分割的代碼實現 137
7.7.1 創建環境 138
7.7.2 準備COCO數據集資料夾結構 139
7.7.3 在COCO數據集上運行預訓練模型 139
7.8 參考文獻 139
7.9 本章小結 141
第8章 GAN:使用CNN生成新圖像 143
8.1 Pix2pix:基於GAN的圖像翻譯 144
8.1.1 CycleGAN 144
8.1.2 訓練GAN模型 145
8.2 GAN的代碼示例 146
8.2.1 計算損失 149
8.2.2 半監督學習和GAN 151
8.3 特徵匹配 152
8.3.1 基於半監督分類的GAN示例 152
8.3.2 深度卷積GAN 158
8.4 本章小結 159
第9章 CNN和視覺模型的注意力機制 161
9.1 圖像描述中的注意力機制 164
9.2 注意力類型 168
9.2.1 硬注意力 168
9.2.2 軟注意力 169
9.3 運用注意力改善視覺模型 170
9.3.1 視覺CNN模型次優性能的原因 171
9.3.2 循環視覺注意力模型 174
9.4 參考文獻 180
9.5 本章小結 181

作者簡介

Mohit Sewak是IBM的高級認知數據科學家,也是比爾拉技術與科學學院的人工智慧和計算機科學博士。他在人工智慧、深度學習和機器學習方面擁有多項專利和著作。他曾是一些非常成功的人工智慧/機器學習軟體和行業解決方案的首席數據科學家,並在早期就參與了沃森認知商業產品線的解決方案研究。他在TensorFlow、Torch、Caffe、Theano、Keras、Watson等架構的設計和解決方案方面有14年的豐富經驗。
Md. Rezaul Karim是德國Fraunhofer FIT的研究科學家。他也是德國亞琛工業大學的博士研究生。在加入FIT之前,他曾在愛爾蘭的Insight數據分析中心擔任研究員。他也曾是韓國三星電子的首席工程師。
他在C++、Java、R、Scala和Python方面有9年的研發經驗,也在生物信息學、大數據和深度學習方面發表過研究論文。此外在Spark、Zeppelin、Hadoop、Keras、Scikit-Learn、TensorFlow、Deeplearning4j、MXNet、H2O等方面都有實際的工作經驗。
Pradeep Pujari是沃爾瑪實驗室的機器學習工程師,也是ACM的傑出成員。他的核心專業領域是信息檢索、機器學習和自然語言處理。在空閒的時候,他喜歡研究人工智慧技術、閱讀和輔導。

相關詞條

熱門詞條

聯絡我們