計算機視覺原理與實踐

《計算機視覺原理與實踐》是2022年電子工業出版社出版的圖書,作者是許桂秋、白宗文、張志立。

基本介紹

  • 書名:計算機視覺原理與實踐
  • 作者:許桂秋、白宗文、張志立
  • 出版社:電子工業出版社
  • 出版時間:2022年12月
  • 頁數:252 頁
  • 定價:49.80 元
  • 開本:16 開
  • ISBN:9787121447419
內容簡介,圖書目錄,

內容簡介

本書結合理論和實踐,主要介紹如何使用圖像處理和深度學習技術來使計算機感知和理解圖形。全書分為概述、OpenCV 圖像基本操作、深度學習與計算機視覺、計算機視覺基礎技術、計算機視覺綜合套用五大部分(共 11 章)。概述部分(第 1 章)主要介紹計算機視覺的概念和發展史;OpenCV 圖像基本操作(第 2 章)主要介紹基於OpenCV 的圖像處理操作;深度學習與計算機視覺(第3 章)主要介紹深度學習的概念及其套用、深度學習的實現框架TensorFlow 的用法以及卷積神經網路的概念、結構和算法;計算機視覺基礎技術(第4~9 章)主要介紹圖像分類、目標檢測、圖像分割、場景文字識別、人體關鍵點檢測、圖像生成等關鍵技術的原理、方法及套用;計算機視覺綜合套用(第 10、11 章)主要介紹視覺互動機器人和無人駕駛的自動巡線兩個大型綜合實驗。本書圍繞基本理論,設定了較多的實驗操作和實踐案例,通過自己動手練習,幫助讀者鞏固所學內容。

圖書目錄

第1章 概述
1.1 什麼是計算機視覺
1.2 計算機視覺的發展史
第2章 OpenCV圖像基本操作
2.1 如何使用OpenCV
2.2 圖像的基礎操作
2.2.1 圖像的基本表示方法
2.2.2 圖像的讀取、顯示和存儲
2.2.3 視頻序列的讀取和存儲
2.2.4 圖像像素的處理與訪問
2.2.5 獲取圖像屬性
2.2.6 圖像RoI
2.2.7 圖像通道的拆分與合併
2.3 圖像的幾何變換
2.3.1 圖像縮放
2.3.2 圖像翻轉
2.3.3 圖像仿射變換
2.3.4 圖像透視
2.4 圖像的算術運算
2.4.1 圖像的加法運算
2.4.2 圖像的加權和運算
2.4.3 圖像的按位邏輯運算
第3章 深度學習與計算機視覺
3.1 深度學習概述
3.1.1 深度學習的概念
3.1.2 深度學習的發展歷程
3.2 卷積神經網路
3.2.1 卷積神經網路的研究歷史與意義
3.2.2 卷積神經網路的基本結構
3.2.3 卷積神經網路的工作原理
3.2.4 卷積神經網路的發展趨勢
3.2.5 實驗——機器人識別你的字
3.3 基於深度學習的計算機視覺
3.3.1 計算機視覺與深度學習的關係
3.3.2 計算機視覺和深度學習發展的加速器——GPU
3.3.3 計算機視覺與深度學習的基礎與研究方向
3.4 深度學習的實現框架TensorFlow
3.4.1 TensorFlow簡介
3.4.2 TensorFlow環境的搭建
3.4.3 TensorFlow計算模型——計算圖
3.4.4 TensorFlow數據模型——張量
3.4.5 TensorFlow運行模型——會話
第4章 圖像分類
4.1 定義與套用場景
4.2 實現方法
4.3 常用數據集
4.4 實驗——機器人看圖識物
4.5 實驗——機器人識別人臉表情
第5章 目標檢測
5.1 定義與套用場景
5.2 實現方法
5.2.1 基於候選區域的目標檢測算法
5.2.2 基於直接回歸的目標檢測算法
5.3 常用數據集
5.4 實驗——機器人捕捉人臉並識別
5.5 實驗——無人駕駛中的目標檢測
第6章 圖像分割
6.1 定義與套用場景
6.2 實現方法
6.2.1 基於特徵編碼的模型
6.2.2 基於區域選擇的模型
6.2.3 基於上採樣/反卷積的模型
6.2.4 基於RNN的模型
6.2.5 基於提高特徵解析度的模型
6.3 常用數據集
6.4 實驗——無人駕駛場景感知
第7章 場景文字識別
7.1 定義與套用場景
7.2 實現方法
7.2.1 傳統方法時期
7.2.2 深度學習方法時期
7.3 常用數據集
7.4 實驗——無人值守車牌識別機器人
……
第8章 人體關鍵點檢測
第9章 圖像生成
第10章 視覺互動機器人
第11章 無人駕駛的自動巡線

相關詞條

熱門詞條

聯絡我們