《計算機視覺——Python+TensorFlow+Keras深度學習實戰(微課視頻版)》是2021年清華大學出版社出版的圖書,作者是袁雪。
基本介紹
- 中文名: 計算機視覺——Python+TensorFlow+Keras深度學習實戰(微課視頻版)
- 作者:袁雪
- 出版社: 清華大學出版社
- 出版時間:2021年
- 定價:39.80 元
- ISBN: 9787302579250
內容簡介,圖書目錄,
內容簡介
人工智慧正在成為全世界產業變革的方向,處於第四次科技革命的核心地位。計算機視覺(Computer Vision)就是利用攝像機、算法和計算資源為人工智慧系統按上“眼睛”,讓其可以擁有人類的雙眼所具有的前景與背景分割、物體識別、目標跟蹤、判別決策等功能。計算機視覺系統可以讓計算機看見並理解這個世界的“信息”,從而替代人類完成重複性工作。目前計算機視覺領域熱門的研究方向有物體檢測和識別、語義分割、目標跟蹤等。本書圍繞著計算機視覺的關鍵技術,介紹基於深度學習計算機視覺的基礎理論及主要算法。本書結合常見的套用場景和項目實例,循序漸進地帶領讀者進入美妙的計算機視覺世界。本書共分為11章,2~5章介紹計算機視覺的幾種關鍵技術,即圖像分類、目標檢測、圖像分割和目標跟蹤,並將這四項關鍵技術組合完成人工智慧的實際套用。本書在6、7章介紹人工智慧的兩個典型套用:文字檢測與識別系統及多任務深度學習系統,第8章介紹一種非常有意思的深度學習網路——對抗生成神經網路,第9章介紹製作訓練和測試樣本的方法,第10章介紹如何安裝TensorFlow、Keras API及相關介紹,第11章介紹綜合實驗。本書提供了大量項目實例及代碼解析,均是基於Python語言及TensorFlow、Keras API的。本教材的每章均配有微課視頻,掃描每章的二維碼,可觀看作者的視頻講解
圖書目錄
第1章 人工智慧概述 1
1.1 人工智慧的發展浪潮 1
1.2 AI技術發展歷史 4
1.2.1 AI技術三要素之算法 4
1.2.2 AI技術三要素之計算資源 6
1.2.3 AI三要素之數據 6
1.3 視頻分析技術的套用案例 9
1.3.1 基於人臉識別技術的罪犯抓捕系統 9
1.3.2 基於文字識別技術的辦公自動化系統 10
1.3.3 基於圖像分割及目標檢測技術的無人駕駛環境感知系統 10
1.3.4 基於目標檢測及跟蹤技術的電子交警系統 10
1.3.5 基於圖像比對技術的產品缺陷檢測系統 10
1.3.6 基於行為識別技術的安全生產管理系統 10
1.4 本章小結 10
第2章 深度卷積神經網路 11
2.1 深度卷積神經網路的概念 11
2.2 卷積神經網路的構成 12
2.2.1 卷積層 12
2.2.2 激活函式 12
2.2.3 池化層 14
2.3 深度卷積神經網路模型結構 14
2.3.1 常用網路模型 14
2.3.2 網路模型對比 20
2.4 圖像分類 20
2.5 遷移學習 21
2.6 圖像識別項目實例 22
2.6.1 下載ImageNet的訓練模型 22
2.6.2 ResNet模型構建 23
2.6.3 測試圖像 26
2.7 本章小結 27
2.8 習題 27
第3章 目標檢測 28
3.1 目標檢測的概念 28
3.2 基於候選區域的目標檢測算法 29
3.2.1 Faster R-CNN目標檢測算法 30
3.2.2 基於區域的全卷積網路(R-FCN)目標檢測算法 30
3.3 基於回歸的目標檢測算法 32
3.3.1 YOLO目標檢測算法 32
3.3.2 SSD目標檢測算法 33
3.4 目標檢測算法評價指標 34
3.5 深度卷積神經網路目標檢測算法性能對比 35
3.6 目標檢測項目實戰 36
3.6.1 Faster R-CNN 36
3.6.2 用YOLO訓練自己的模型 40
3.7 本章小結 43
3.8 習題 43
第4章 圖像分割 44
4.1 圖像分割的概念 44
4.2 典型的圖像分割算法 45
4.2.1 FCN分割算法 45
4.2.2 DeepLab分割算法 45
4.2.3 SegNet圖像分割算法 47
4.2.4 U-Net算法 47
4.2.5 Mask R-CNN算法 48
4.3 圖像分割評價標準 49
4.4 圖像分割項目實戰 50
4.4.1 FCN32模型構建 51
4.4.2 FCN8的模型構建 52
4.4.3 Seg-Net的模型構建 53
4.4.4 U-Net的模型構建 56
4.5 本章小結 59
4.6 習題 59
第5章 目標跟蹤 60
5.1 圖像分割的概念 60
5.2 基於光流特徵的目標跟蹤算法 63
5.2.1 基於光流特徵跟蹤算法概述 63
5.2.2 LK光流法 65
5.3 SORT目標跟蹤算法 66
5.3.1 卡爾曼濾波器 66
5.3.2 基於匈牙利算法的數據關聯 68
5.4 Deep SORT多目標跟蹤算法 69
5.4.1 Deep SORT算法跟蹤原理 69
5.4.2 外觀特徵間的關聯性計算 69
5.4.3 利用運動信息關聯目標 71
5.4.4 級聯匹配 71
5.5 目標跟蹤算法評價指標 72
5.6 Deep SORT算法主要程式及分析 72
5.6.1 目標檢測框的獲取及坐標轉換 72
5.6.2 卡爾曼濾波 73
5.6.3 深度外觀特徵的提取 77
5.6.4 匹配 78
5.6.5 後續處理 79
5.7 本章小結 81
5.8 習題 81
第6章 OCR文字識別 82
6.1 OCR文字識別的概念 82
6.2 文字檢測 83
6.2.1 傳統的文字檢測算法 83
6.2.2 基於深度學習的文字檢測算法 83
6.3 文字識別算法 89
6.3.1 基於DenseNet網路模型的序列特徵提取 89
6.3.2 基於LSTM結構的上下文序列特徵提取 91
6.3.3 字元序列的解碼方式 92
6.4 項目實戰 95
6.4.1 CRAFT模型搭建 96
6.4.2 CRNN模型搭建 97
6.4.3 文字檢測與識別程式 99
6.5 本章小結 104
6.6 習題 105
第7章 多任務深度學習網路 106
7.1 多任務深度學習網路的概念 107
7.2 多任務深度學習網路構建 107
7.2.1 多任務網路的主要分類 107
7.2.2 並行式網路 109
7.2.3 級聯式網路 110
7.3 多任務深度學習網路的代碼實現 113
7.3.1 構建多任務深度學習網路 114
7.3.2 多任務深度學習網路的訓練 116
7.3.3 多任務深度學習模型測試 116
7.4 本章小結 119
7.5 習題 119
第8章 生成對抗神經網路 120
8.1 生成對抗網路的概念 120
8.2 典型的生成對抗網路 121
8.2.1 DCGAN 121
8.2.2 CycleGAN 123
8.3 傳送帶表面缺陷樣本增強案例 126
8.4 項目實戰 128
8.4.1 DCGAN 128
8.4.2 CycleGAN 130
8.5 本章小結 132
8.6 習題 132
第9章 樣本製作與數據增強 133
9.1 數據的獲取 133
9.2 數據的標註 133
9.2.1 目標檢測與識別標註軟體LabelImg 134
9.2.2 圖像分割標註軟體LabelMe 134
9.3 數據增強 134
9.4 項目實戰:數據增強 135
9.4.1 數據增強庫的安裝與卸載 135
9.4.2 數據增強庫的基本使用 136
9.4.3 樣本數據增強的結果 136
9.4.4 關鍵點變換 137
9.4.5 標註框(Bounding Box)變換 139
9.5 本章小結 141
9.6 習題 141
第10章 Keras安裝和API 142
10.1 安裝Keras 142
10.1.1 第1步——安裝依賴項 142
10.1.2 第2步——安裝TensorFlow 144
10.1.3 第3步——安裝Keras 145
10.1.4 第4步——測試TensorFlow和Keras 145
10.2 配置Keras 146
10.3 Keras API 146
10.4 TensorFlow API 146
10.5 本章小結 147
第11章 綜合實驗:基於YOLO和Deep Sort的目標檢測與跟蹤 148
11.1 算法流程 148
11.2 實驗代碼 149
11.3 實驗評價 155