基本介紹
- 中文名:深度強化學習:基礎、研究與套用
- 作者:董豪 、丁子涵 、仉尚航
- 出版社:電子工業出版社
- 出版時間:2021年7月
- 頁數:520 頁
- 定價:129 元
- 開本:16 開
- ISBN:9787121411885
《深度強化學習:基礎、研究與套用》1是電子工業出版社出版圖書,作者是董豪 ,丁子涵 ,仉尚航等。一本書輕鬆搞懂深度學習、強化學習、模仿學習、並行計算、多智慧型體強化學習等內容簡介深度強化學習結合深度學習與強化學習算法各自的...
基於卷積神經網路的深度強化學習 由於卷積神經網路對圖像處理擁有天然的優勢,將卷積神經網路與強化學習結合處理圖像數據的感知決策任務成了很多學者的研究方向。深度Q網路是深度強化學習領域的開創性工作。它採用時間上相鄰的4幀遊戲畫面作為原始圖像輸入,經過深度卷積神經網路和全連線神經網路,輸出狀態動作Q函式,實現了端...
簡潔清晰的語言 生動形象的圖示,助你掃除任何可能的學習障礙!本書內容分為五部分:基礎知識、價值學習、策略學習、多智慧型體強化學習、套用與展望,涉及DQN、A3C、TRPO、DDPG、AlphaGo等。本書面向深度強化學習入門讀者,助你構建完整的知識體系。學完本書,你能夠輕鬆看懂深度強化學習的實現代碼、讀懂該領域的論文、...
《深度學習基礎與套用》是2021年北京理工大學出版社出版的圖書,作者是武玉偉、梁瑋、裴明濤。內容簡介 《深度學習基礎與套用》分四部分介紹深度學習算法模型及相關套用實例。分介紹在深度學習中的一些數學和機器學習的基礎知識。第二部分介紹卷積神經網路、循環神經網路、深度強化網路等經典模型,並對每種模型從原理、結構...
《Python深度強化學習——使用PyTorch, TensorFlow 和OpenAI》是清華大學出版社於2022年出版的書籍,作者是[印]尼米什·桑吉(Nimish Sanghi)。內容簡介 本書重點突出深度強化學習理論的基本概念、前沿基礎理論和Python套用實現。首先介紹馬爾可夫決策、基於模型的算法、無模型方法、動態規劃、蒙特卡洛和函式逼近等基礎...
求解強化學習問題所使用的算法可分為策略搜尋算法和值函式(value function)算法兩類。深度學習模型可以在強化學習中得到使用,形成深度強化學習。強化學習理論受到行為主義心理學啟發,側重線上學習並試圖在探索-利用(exploration-exploitation)間保持平衡。不同於監督學習和非監督學習,強化學習不要求預先給定任何數據,...
《深度強化學習:學術前沿與實戰套用》是2020年機械工業出版社出版的圖書,作者是劉馳,王占健,戴子彭。內容簡介 本書共分為四篇,即深度強化學習、多智慧型體深度強化學習、多任務深度強化學習和深度強化學習的套用。由淺入深、通俗易懂,涵蓋經典算法和近幾年的前沿技術進展。特別是書中詳細介紹了每一種代表性算法...
《深度強化學習圖解》是2022年清華大學社出版的圖書 ,作者是米格爾·莫拉萊斯(Miguel Morales),譯者是郭濤。內容簡介 我們在與環境互動的過程中進行學習,經歷的獎勵或懲罰將指導我們未來的行為。深度強化學習將該過程引入人工智慧領域,通過分析結果來尋找最有效的前進方式。DRL智慧型體可提升行銷效果、預測股票漲跌,...
本書基於PyTorch框架,用通俗易懂的語言深入淺出地介紹了強化學習的基本原理,包括傳統的強化學習基本方法和目前流行的深度強化學習方法。在對強化學習任務建模的基礎上,首先介紹動態規劃法、蒙特卡洛法、時序差分法等表格式強化學習方法,然後介紹在PyTorch框架下,DQN、DDPG、A3C等基於深度神經網路的大規模強化學習方法。
Machine Zone的人工智慧工程師,致力於將深度強化學習套用於工業問題。他擁有理論物理和計算機科學的背景。他們共同開發了兩個深度強化學習軟體庫,並就此進行了多次主題講座和技術輔導。主要譯者:許靜 南開大學人工智慧學院副院長,機器智慧型所所長,教授,博士生導師。2003年獲得南開大學博士學位,主要研究方向為人工智慧、...
本書從原理的角度,力求講解清楚深度學習、強化學習、深度強化學習中的一些精選方法,並從實踐的角度,通過一系列循序漸進的原創實驗,引領讀者獨立編程實現這些方法,以期為讀者精通深度強化學習並套用深度強化學習方法解決實際問題奠定堅實基礎。前言 “水之積也不厚,則其負大舟也無力。風之積也不厚,則其負大翼也...
《深度強化學習:基於Python的理論及實踐》是2020年12月1日機械工業出版社出版的圖書,作者是勞拉·格雷澤、[Laura、Graesser]、華龍·肯、(Wah...)。內容簡介 這本書是針對計算機科學專業大學生和軟體工程師的。本課程旨在介紹深度強化學習,無需事先了解相關主題。但是,我們假設讀者對機器學習和深度學習有基本的...
以幫助讀者從整體上輕鬆理解深度強化學習。同時本書的另一個特點是面向實踐,從簡單到非常複雜,將每種方法實際套用在各種具體環境中,以幫助讀者在實際研究和工作中套用深度強化學習來解決問題。本書適合深度強化學習、機器學習、人工智慧相關行業從業者、學習者閱讀參考 ...
書中詳細介紹了深度強化學習相關算法,如Rainbow、Ape-X算法等,並闡述了相關算法的具體實現方式和代表性套用(如AlphaGo)。此外,本書還深度剖析了強化學習各算法之間的聯繫,有助於讀者舉一反三。本書分為四篇:初探強化學習、求解強化學習、求解強化學習進階和深度強化學習。涉及基礎理論到深度強化學習算法框架的各...
《深度強化學習算法與實踐:基於PyTorch的實現》是2022年4月電子工業出版社出版圖書,作者是張校捷 從基礎理論到項目實踐,詳細介紹新版本PyTorch在強化學習領域中的套用。內容簡介 從強化學習的基礎知識出發,結合PyTorch 深度學習框架,介紹深度強化學習算法各種模型的相關算法原理和基於PyTorch 的代碼實現 圖書目錄 第1章 ...
最後介紹了深度強化學習在不同領域的幾個套用實例。引例、基礎知識和實例相結合,方便讀者理解和學習。《揭秘深度強化學習 人工智慧機器學習技術叢書》內容豐富,講解全面、語言描述通俗易懂,是深度強化學習算法入門的優選。本書適合計算機專業本科相關學生、人工智慧領域的研究人員以及所有對機器學習和人工智慧算法感興趣的...
3.3 通過簡單的示例來學習 3.4 套用到Q學習問題中 3.4.1 狀態 3.4.2 行動 3.4.3 獎勵 3.4.4 Q值 3.5 使用Python進行訓練 3.5.1 運行程式 3.5.2 說明程式 3.6 基於OpenAI Gym的倒立擺 3.6.1 運行程式 3.6.2 說明程式 3.7 如何保存和載入Q值 第4章深度強化學習 4.1 什麼...
第一部分主要闡述強化學習領域的基本理論知識;第二部分講解深度強化學習常用算法的原理、各算法之間的繼承與發展,以及各自的算法流程;第三部分總結深度強化學習算法在遊戲、推薦系統等領域的套用;第四部分探討了該領域存在的問題和發展前景。 本書適合對強化學習感興趣的讀者閱讀。目錄 第I 部分基礎理論篇 1 第1...
1.5 套用 //14 1.5.1 盈利性套用 // 14 1.5.2 成功案例 // 14 1.5.3 面向企業的深度學習 // 19 1.6 未來的潛力和挑戰 // 20 1.7 小結 //21 第 2章 為深度學習做準備 // 22 2.1 線性代數的基礎知識 // 22 2.1.1 數據表示 // 22 2.1.2 數據操作 // 23 2.1.3 ...
全書核心內容可以分為3部分,第一部分為經典強化學習,包括第2、3、4章,主要內容有動態規劃法,蒙特卡洛法、時序差分法;第二部分為深度強化學習,包括第6、7、8章,主要內容有值函式近似法、策略梯度法、策略梯度法進階;第三部分重點介紹了深度強化學習的經典套用——AlphaGo系列算法。另外,作為理論和算法的輔助...
第18章 機器人技術中的強化學習 第19章 置信域:PPO、TRPO、ACKTR及SAC 第20章 強化學習中的黑盒最佳化 作者簡介 馬克西姆·拉潘(Maxim Lapan),一位深度學習愛好者和獨立研究者。他擁有15年軟體開發和系統架構經驗,涵蓋從低級Linux核心驅動程式開發到性能最佳化以及在數千台伺服器上工作的分散式套用程式設計的方方面...
現階段,強化學習研究的核心問題是如何解決維數災難,提高學習效率。強化學習原理及其套用的主要內容正是針對上述問題展開的,分別從值函式逼近、直接策略搜尋和基於譜方法的學習3 個方面來闡述強化學習的理論、方法及其套用,共13 章。第1 章~第2 章為強化學習概述和相關基礎理論。第3 章~第5 章為基於值函式估計的...
回顧人工智慧幾十年經歷過的起起落落,希望對人工智慧及深度學習感興趣的讀者通過本書的學習能夠更加理性、更加全面地看待這個行業,理解人工智慧尤其是深度學習的原理並套用,根據當前的技術現狀合理地套用深度學習去改變人們的工作、生活和學習。文章目錄 第1章人工智慧的基本概念 1.1人工智慧的發展歷史1 1.2機器學習...
《機器學習、深度學習與強化學習》是2019年5月智慧財產權出版社出版的圖書,作者是林強。內容簡介 本書從數學最佳化的角度對目前人工智慧的代表技術機器學習進行分析,解決了目前這一領域偏向套用,數學理論較弱的問題,從原理、數學解析兩個方面對特徵提取、分類、聚類、神經網路等進行了全面系統的剖析。解決了目前人工智慧...
第四篇深度強化學習 第12章深度學習.116 12.1神經網路基礎.116 12.1.1神經網路解決問題的基本流程117 12.1.2激活函式117 12.1.3損失函式119 12.1.4最佳化算法120 12.2典型深度神經網路結構.123 12.2.1深度的作用123 12.2.2卷積神經網路.124 12.2.3循環神經網路.125 參考文獻.127 第13章深度Q-網路...
《深度學習——從神經網路到深度強化學習的演進》是清華大學出版社於2021年出版的書籍,作者是魏翼飛、汪昭穎、李駿。內容簡介 本書首先概述人工智慧、深度學習相關的基本概念和發展歷程;然後詳細介紹深度學習的基本理論和 算法,包括神經網路的關鍵技術、卷積神經網路的主要框架和套用實例、循環神經網路和無監督學習深度 ...
強化學習(RL)的新發展結合深度學習(DL),在訓練代理以類似人的方式解決複雜問題方面取得了未有的進步。Google使用算法在著名的Atari街機遊戲中獲勝將該領域推至高峰,研究人員也在源源不斷地產生新的想法。《深度強化學習實踐(影印版 英文版)》介紹了RL的基礎知識,為你提供了編寫智慧型學習代理所需的原理,以承擔...
第1章介紹強化學習(Reinforcement Learning, RL)概況,包括發展歷史、知名學者、典型套用以及主要挑戰等。第2章介紹RL的基礎知識,包括定義概念、自洽條件、最優性原理與問題架構等。第3章介紹免模型RL的蒙特卡洛法,包括Monte Carlo估計、On-policy/Off-policy、重要性採樣等。第4章介紹免模型RL的時...