《深度強化學習落地指南》是電子工業出版社出版圖書,作者是魏寧。
一本討論強化學習落地套用的技術書,從實用性角度對強化學習進行歸納和梳理,重點圍繞如何解決實際問題展開
基本介紹
- 中文名:深度強化學習落地指南
- 作者:魏寧
- 出版社:電子工業出版社
- 出版時間:2021年8月
- 頁數:202 頁
- 定價:109 元
- 開本:16 開
- ISBN:9787121416446
《深度強化學習落地指南》是電子工業出版社出版圖書,作者是魏寧。
一本討論強化學習落地套用的技術書,從實用性角度對強化學習進行歸納和梳理,重點圍繞如何解決實際問題展開
《深度強化學習落地指南》1是電子工業出版社出版圖書,作者是魏寧。一本討論強化學習落地套用的技術書,從實用性角度對強化學習進行歸納和梳理,重點圍繞如何解決實際問題展開內容簡介跳出原理介紹加套用案例的傳統敘述模式,轉而在橫向...
《深度強化學習:入門與實踐指南》是2021年機械工業出版社出版的圖書。強化學習是機器學習發展非常迅速的一個領域,由於其靈活性和通用性,可以套用在從玩遊戲到最佳化複雜製造過程的許多實際情況。本書幫助讀者迅速理解深度強化學習,並從原理...
深度Q網路是深度強化學習領域的開創性工作。它採用時間上相鄰的4幀遊戲畫面作為原始圖像輸入,經過深度卷積神經網路和全連線神經網路,輸出狀態動作Q函式,實現了端到端的學習控制。深度Q網路使用帶有參數θ的Q函式Q(s, a; θ)去逼近值...
《深度強化學習圖解》是2022年清華大學社出版的圖書 ,作者是米格爾·莫拉萊斯(Miguel Morales),譯者是郭濤。內容簡介 我們在與環境互動的過程中進行學習,經歷的獎勵或懲罰將指導我們未來的行為。深度強化學習將該過程引入人工智慧領域,...
《深度強化學習:基於Python的理論及實踐》是2020年12月1日機械工業出版社出版的圖書,作者是勞拉·格雷澤、[Laura、Graesser]、華龍·肯、(Wah...)。內容簡介 這本書是針對計算機科學專業大學生和軟體工程師的。本課程旨在介紹深度強化...
《深度強化學習原理與實踐》是2019年7月人民郵電出版社出版的圖書,作者是陳仲銘、何明。內容簡介 本書構建了一個完整的深度強化學習理論和實踐體系:從馬爾可夫決策過程開始,根據價值函式、策略函式求解貝爾曼方程,到利用深度學習模擬價值...
本書系統地介紹了強化學習的原理和實現,是一本理論紮實、落地性強的圖書。本書包含3個部分:第一部分為強化學習基礎,講解強化學習的基礎概念和表格型強化學習方法;第二部分為強化學習進階,討論深度強化學習的思維方式、深度價值函式和...
《深度強化學習:基礎、研究與套用》是電子工業出版社出版圖書,作者是董豪 ,丁子涵 ,仉尚航等。一本書輕鬆搞懂深度學習、強化學習、模仿學習、並行計算、多智慧型體強化學習等 內容簡介 深度強化學習結合深度學習與強化學習算法各自的優勢...
《深度強化學習理論與實踐》是清華大學出版社出版的圖書。內容簡介 本書比較全面、系統地介紹了深度強化學習的理論和算法,並配有大量的案例和編程實現。全書核心內容可以分為3部分,第一部分為經典強化學習,包括第2、3、4章,主要內容...
《深度強化學習:學術前沿與實戰套用》是2020年機械工業出版社出版的圖書,作者是劉馳,王占健,戴子彭。內容簡介 本書共分為四篇,即深度強化學習、多智慧型體深度強化學習、多任務深度強化學習和深度強化學習的套用。由淺入深、通俗易懂...
《深度強化學習實踐》是2021年機械工業出版社出版的圖書。內容簡介 本書理論與實踐相結合,系統闡述強化學習的基礎知識,以及如何動手編寫智慧型體以執行一系列實際任務。通過閱讀本書,讀者將獲得深層Q網路、策略梯度方法、連續控制問題以及高度...
深度強化學習結合了深度學習和強化學習,使人工智慧體能夠在沒有監督的情況下學習如何解決順序決策問題。在過去的十年中,深度強化學習在一系列問題上取得了顯著的成果,涵蓋從單機遊戲和多人遊戲到機器人技術等方方面面。本書採用理論結合...
《深度強化學習實踐(影印版英文版)》是2019年東南大學出版社出版的圖書,作者是Maxim,Lapan。內容簡介 強化學習(RL)的新發展結合深度學習(DL),在訓練代理以類似人的方式解決複雜問題方面取得了未有的進步。Google使用算法在著名的...
《Python深度強化學習:基於Chainer和OpenAI Gym》是由2021年11月機械工業出版社出版的圖書。作品簡介 近年來,機器學習受到了人們的廣泛關注。本書面向普通大眾,指導讀者在Python(基於Chainer和OpenAI Gym)中實踐深度強化學習。讀者只需要...
《邊做邊學深度強化學習:PyTorch程式設計實踐》是2020年機械工業出版社出版的圖書。內容簡介 Pytorch是基於python且具備強大GPU加速的張量和動態神經網路,更是Python中優先的深度學習框架,它使用強大的 GPU 能力,提供極高的靈活性和速度。