計算機視覺之深度學習:使用TensorFlow和Keras訓練高級神經網路

計算機視覺之深度學習:使用TensorFlow和Keras訓練高級神經網路

《計算機視覺之深度學習:使用TensorFlow和Keras訓練高級神經網路》是人民郵電出版社出版的圖書,作者是[英]拉賈林加帕•尚穆加馬尼。

基本介紹

  • 中文名:計算機視覺之深度學習:使用TensorFlow和Keras訓練高級神經網路 
  • 作者:[英]拉賈林加帕•尚穆加馬尼
  • 出版時間:2020年2月
  • 出版社:人民郵電出版社
  • 頁數:216 頁
  • ISBN:9787115531582
  • 定價:59.00 元
  • 裝幀:平裝
內容簡介,圖書目錄,作者簡介,

內容簡介

深度學習已在人工智慧的多個套用領域(尤其是計算機視覺)中展示了其強大功能。計算機視覺是理解和處理圖像的科學,並且在機器人技術、自動化等領域有廣泛的套用。 本書通過實例展示了如何利用深度學習的力量來開發計算機視覺應用程式,介紹了與圖像分類、圖像檢索、目標檢測、語義分割、圖像題注、生成模型等有關的各種技術。你將使用流行的Python庫(例如TensorFlow和Keras)探索計算機視覺應用程式,從而掌握各種深度學習算法及其實現。 ●使用TensorFlow和Keras設定深度學習的環境 ●探索圖像分類方法並訓練一個深度學習模型 ●使用預訓練的卷積神經網路模型進行圖像檢索 ●了解檢測方法並實施行人檢測 ●了解圖像題注中的各種問題及其實現 ●訓練一個使用生成對抗網路生成圖像的模型 ●了解視頻分類的方法及其實現 ●部署深度學習模型並進行最佳化

圖書目錄

第 1 章 入門 1
1.1 理解深度學習 1
1.1.1 感知機 1
1.1.2 激活函式 2
1.1.3 人工神經網路 4
1.1.4 訓練神經網路 7
1.1.5 嘗試TensorFlow遊樂場 8
1.1.6 卷積神經網路 8
1.1.7 循環神經網路 10
1.1.8 長短期記憶網路 11
1.2 計算機視覺深度學習 12
1.2.1 分類 12
1.2.2 檢測或定位與分割 12
1.2.3 相似性學習 13
1.2.4 圖像題注 13
1.2.5 生成模型 14
1.2.6 視頻分析 15
1.3 建立開發環境 15
1.3.1 硬體和作業系統 15
1.3.2 安裝軟體包 17
1.4 小結 23
第 2 章 圖像分類 24
2.1 在TensorFlow中訓練MNIST模型 24
2.1.1 MNIST數據集 24
2.1.2 載入MNIST數據 25
2.1.3 建立一個感知機 25
2.1.4 構建多層卷積網路 28
2.2 在Keras中訓練MNIST模型 35
2.2.1 準備數據集 35
2.2.2 構建模型 36
2.3 其他流行的圖像測試數據集 38
2.3.1 CIFAR數據集 38
2.3.2 Fashion-MNIST數據集 38
2.3.3 ImageNet數據集和競賽 39
2.4 更大的深度學習模型 40
2.4.1 AlexNet模型 40
2.4.2 VGG-16模型 41
2.4.3 谷歌Inception-V3模型 42
2.4.4 微軟ResNet-50模型 45
2.4.5 SqueezeNet模型 45
2.4.6 空間變換網路模型 46
2.4.7 DenseNet模型 47
2.5 訓練貓與狗的模型 47
2.5.1 準備數據 48
2.5.2 使用簡單CNN進行基準測試 48
2.5.3 增強數據集 49
2.5.4 遷移學習或微調模型 50
2.5.5 在深度學習中微調一些層 51
2.6 開發現實世界的套用 53
2.6.1 選擇正確的模型 53
2.6.2 處理欠擬合和過擬合場景 53
2.6.3 從面部檢測性別和年齡 54
2.6.4 微調服裝模型 54
2.6.5 品牌安全 54
2.7 小結 54
第 3 章 圖像檢索 55
3.1 理解視覺特徵 55
3.1.1 深度學習模型的可視化激活 56
3.1.2 嵌入可視化 57
3.1.3 DeepDream 60
3.1.4 對抗樣本 64
3.2 模型推斷 65
3.2.1 導出模型 65
3.2.2 提供訓練好的模型 66
3.3 基於內容的圖像檢索 68
3.3.1 構建檢索流水線 68
3.3.2 有效的檢索 71
3.3.3 使用自編碼器去噪 74
3.4 小結 77
第 4 章 目標檢測 78
4.1 檢測圖像中的目標 78
4.2 探索數據集 79
4.2.1 ImageNet數據集 79
4.2.2 PASCAL VOC挑戰 79
4.2.3 COCO目標檢測挑戰 79
4.2.4 使用指標評估數據集 80
4.3 目標定位算法 81
4.3.1 使用滑動視窗定位目標 82
4.3.2 將定位看作回歸問題 83
4.4 檢測目標 86
4.4.1 R-CNN(區域卷積神經網路) 86
4.4.2 Fast R-CNN 86
4.4.3 Faster R-CNN 87
4.4.4 SSD(單射多框探測器) 88
4.5 目標檢測API 88
4.5.1 安裝和設定 88
4.5.2 預訓練模型 89
4.5.3 重新訓練目標檢測模型 90
4.5.4 為自動駕駛汽車訓練行人檢測 92
4.6 YOLO目標檢測算法 92
4.7 小結 94
第 5 章 語義分割 95
5.1 預測像素 95
5.1.1 診斷醫學圖像 97
5.1.2 通過衛星圖像了解地球 97
5.1.3 提供機器人視覺 98
5.2 數據集 98
5.3 語義分割算法 98
5.3.1 全卷積網路 98
5.3.2 SegNet架構 99
5.3.3 膨脹卷積 103
5.3.4 DeepLab 104
5.3.5 RefiNet 105
5.3.6 PSPnet 106
5.3.7 大卷積核的重要性 106
5.3.8 DeepLab v3 107
5.4 超神經分割 107
5.5 分割衛星圖像 111
5.6 分割實例 113
5.7 小結 114
第 6 章 相似性學習 115
6.1 相似性學習算法 115
6.1.1 孿生網路 115
6.1.2 FaceNet模型 118
6.1.3 DeepNet模型 120
6.1.4 DeepRank模型 120
6.1.5 視覺推薦系統 121
6.2 人臉分析 122
6.2.1 人臉檢測 122
6.2.2 人臉特徵點和屬性 123
6.2.3 人臉識別 126
6.2.4 人臉聚類 130
6.3 小結 131
第 7 章 圖像題注 132
7.1 了解問題和數據集 132
7.2 理解圖像題注的自然語言處理 132
7.2.1 用向量形式表達詞 133
7.2.2 將詞轉換為向量 133
7.2.3 訓練一個嵌入 134
7.3 圖像題注和相關問題的方法 135
7.3.1 使用條件隨機場來連結圖像和文本 136
7.3.2 在CNN 特徵上使用RNN生成題注 136
7.3.3 使用圖像排序創建題注 138
7.3.4 從圖像檢索題注與從題注檢索圖像 139
7.3.5 密集題注 140
7.3.6 使用RNN生成題注 141
7.3.7 使用多模態度量空間 142
7.3.8 使用注意網路生成題注 143
7.3.9 知道什麼時候查看 143
7.4 實現基於注意力的圖像題注 145
7.5 小結 147
第 8 章 生成模型 148
8.1 生成模型的套用 148
8.1.1 藝術風格遷移 148
8.1.2 預測視頻中的下一幀 149
8.1.3 圖像的超解析度 150
8.1.4 互動式圖像生成 151
8.1.5 圖像到圖像的翻譯 151
8.1.6 文本到圖像的生成 152
8.1.7 圖像修復 153
8.1.8 圖像混合 153
8.1.9 轉換屬性 154
8.1.10 創建訓練數據 154
8.1.11 創建新的動畫角色 155
8.1.12 照片3D模型 155
8.2 神經藝術風格遷移 156
8.2.1 內容損失 156
8.2.2 使用Gram矩陣的風格損失 160
8.2.3 風格遷移 162
8.3 生成對抗網路 165
8.3.1 vanilla GAN 165
8.3.2 條件GAN 167
8.3.3 對抗損失 167
8.3.4 圖像翻譯 168
8.3.5 InfoGAN 168
8.3.6 GAN的缺點 169
8.4 視覺對話模型 169
8.5 小結 171
第 9 章 視頻分類 172
9.1 了解視頻和視頻分類 172
9.1.1 探索視頻分類數據集 172
9.1.2 將視頻分割成幀 175
9.1.3 視頻分類方法 175
9.2 將基於圖像的方法擴展到視頻 184
9.2.1 人體姿態回歸 184
9.2.2 視頻分割 185
9.2.3 視頻題注 186
9.2.4 視頻生成 188
9.3 小結 188
第 10 章 部署 189
10.1 模型的性能 189
10.1.1 量化模型 189
10.1.2 MobileNets 190
10.2 雲部署 193
10.2.1 AWS 193
10.2.2 Google雲平台 197
10.3 在設備中部署模型 200
10.3.1 Jetson TX2 200
10.3.2 Android 201
10.3.3 iPhone 201
10.4 小結 202

作者簡介

作者簡介: 拉賈林加帕•尚穆加馬尼(Rajalingappaa Shanmugamani),目前在Kairos擔任技術經理。在此之前,曾在新加坡SAP公司擔任深度學習主管,也在創業公司從事過計算機視覺產品的開發和諮詢工作。在同行評審的期刊和會議上多次發表文章,並在機器學習領域申請了專利。與他人合著出版了Hands-On Natural Language Processing with Python、Python Reinforcement Learning、Python: Advanced Guide to Artificial Intelligence、TensorFlow Deep Learning Projects等書。 譯者簡介: 白勇,海南大學信息科學技術學院教授、博士生導師、美國歸國博士。長期從事物聯網、人工智慧方面的研究。已承擔國家級和省部級項目10多項,發表學術論文100多篇,授權中國和美國發明專利10多項。

相關詞條

熱門詞條

聯絡我們