深度學習與圖像識別：原理與實踐

內容簡介

這是一部從技術原理、算法和工程實踐3個維度系統講解圖像識別的著作，由阿里巴巴達摩院算法專家、阿里巴巴技術發展專家、阿里巴巴數據架構師聯合撰寫。

在知識點的選擇上，本書廣度和深度兼顧，既能讓完全沒有基礎的讀者迅速入門，又能讓有基礎的讀者深入掌握圖像識別的核心技術；在寫作方式上，本書避開了複雜的數學公式及其推導，從問題的前因後果、創造者的思考過程，利用簡單的數學計算來做模型分析和講解，通俗易懂。更重要的是，本書不僅僅是聚焦於技術，而是將重點放在了如何用技術解決實際的業務問題。

全書一共13章：

第1-2章主要介紹了圖像識別的套用場景、工具和工作環境的搭建；

第3-6章詳細講解了圖像分類算法、機器學習、神經網路、誤差反向傳播等圖像識別的基礎技術及其原理；

第7章講解了如何利用PyTorch來實現神經網路的圖像分類，專注於實操，是從基礎向高階的過渡；

第8-12章深入講解了圖像識別的核心技術及其原理，包括卷積神經網路、目標檢測、分割、產生式模型、神經網路可視化等主題；

第13章從工程實踐的角度講解了圖像識別算法的部署模式。

作者簡介

魏溪含

愛丁堡大學人工智慧碩士，阿里巴巴達摩院算法專家，在計算機視覺、大數據領域有8年以上的算法架構和研發經驗。

在大數據領域，曾帶領團隊對阿里巴巴個性化推薦系統進行升級；計算機視覺領域，主導並攻克了光伏EL全自動瑕疵識別的世界難題，並在行為識別領域帶領團隊參賽打破世界紀錄等。

塗銘

阿里巴巴數據架構師，對大數據、自然語言處理、圖像識別、Python、Java相關技術有深入的研究，積累了豐富的實踐經驗。在工業領域曾參與了燃煤最佳化、設備故障診斷項目，正泰光伏電池片和組件EL圖像檢測項目；在自然語言處理方面，擔任導購機器人項目的架構師，主導開發機器人的語義理解、短文本相似度匹配、上下文理解，以及通過自然語言檢索產品庫，在項目中構建了NoSQL+文本檢索等大數據架構，也同時負責問答對的整理和商品屬性的提取，帶領NLP團隊構建語義解析層。

張修鵬

畢業於中南大學，阿里巴巴技術發展專家，長期從事雲計算、大數據、人工智慧與物聯網技術的商業化套用，在阿里巴巴首次將圖像識別技術引入工業，並推動圖像識別產品化、平台化，擅於整合前沿技術解決產業問題，主導多個大數據和AI為核心的數位化轉型項目成功實施，對技術和商業結合有著深刻的理解。

前言

第1章　機器視覺在行業中的套用1

1.1　機器視覺的發展背景1

1.1.1　人工智慧1

1.1.2　機器視覺2

1.2　機器視覺的主要套用場景3

1.2.1　人臉識別3

1.2.2　視頻監控分析4

1.2.3　工業瑕疵檢測5

1.2.4　圖片識別分析6

1.2.5　自動駕駛/駕駛輔助7

1.2.6　三維圖像視覺8

深度學習與圖像識別：原理與實踐

基本介紹

相關詞條

熱門詞條