深度學習與圍棋

《深度學習與圍棋》是由2021年1月人民郵電出版社出版的圖書。

基本介紹

  • 中文名:深度學習與圍棋 
  • 作者:[美] 馬克斯·帕佩拉(Max Pumperla)
  • 譯者:趙普明
  • 出版社:人民郵電出版社
  • ISBN:9787115551467
作品簡介,作品目錄,

作品簡介

這是一本深入淺出且極富趣味的深度學習入門書。本書選取深度學習近年來最重大的突破之一AlphaGo,將其背後的技術和原理娓娓道來,並配合一套基於BetaGo的開原始碼,帶領讀者從零開始一步步實現自己的“AlphaGo”。本書側重實踐,深入淺出,庖丁解牛般地將深度學習和AlphaGo這樣深奧的話題變得平易近人、觸手可及,內容非常精彩。全書共分為3個部分:第一部分介紹機器學習和圍棋的基礎知識,並構建一個最簡圍棋機器人,作為後面章節內容的基礎;第二部分分層次深入介紹AlphaGo背後的機器學習和深度學習技術,包括樹搜尋、神經網路、深度學習機器人和強化學習,以及強化學習的幾個高級技巧,包括策略梯度、價值評估方法、演員-評價方法3類技術;第三部分將前面兩部分準備好的知識集成到一起,並最終引導讀者實現自己的AlphaGo,以及改進版AlphaGo Zero。讀完本書之後,讀者會對深度學習這個學科以及AlphaGo的技術細節有非常全面的了解,為進一步深入鑽研AI理論、拓展AI套用打下良好基礎。本書不要求讀者對AI或圍棋有任何了解,只需要了解基本的Python語法以及基礎的線性代數和微積分知識。

作品目錄

內容提要
戰罷兩奩分白黑,一枰何處有虧成(譯者序)
前言
資源與支持
致謝
關於本書
關於作者
第一部分 基礎知識
第1章 走近深度學習:機器學習入門
第2章 圍棋與機器學習
第3章 實現第一個圍棋機器人
第二部分 機器學習和遊戲AI
第4章 使用樹搜尋下棋
第5章 神經網路入門
第6章 為圍棋數據設計神經網路
第7章 從數據中學習:構建深度學習機器人
第8章 實地部署圍棋機器人
第9章 通過實踐學習:強化學習
第10章 基於策略梯度的強化學習
第11章 基於價值評估方法的強化學習
第12章 基於演員-評價方法的強化學習
第三部分 一加一大於二
第13章 AlphaGo:全部集結
第14章 AlphaGo Zero:將強化學習集成到樹搜尋中
附錄A 數學基礎
附錄B 反向傳播算法
附錄C 圍棋程式與圍棋伺服器
附錄D 用AWS來訓練和部署圍棋程式與圍棋伺服器
附錄E 將機器人發布到OGS

相關詞條

熱門詞條

聯絡我們