《深度強化學習實踐》是2021年機械工業出版社出版的圖書。
基本介紹
- 中文名:深度強化學習實踐
- 作者:(俄)馬克西姆·拉潘
- 出版時間:2021年
- 出版社:機械工業出版社
- ISBN:9787111687382
《深度強化學習實踐》是2021年機械工業出版社出版的圖書。
《深度強化學習實踐》是2021年機械工業出版社出版的圖書。內容簡介本書理論與實踐相結合,系統闡述強化學習的基礎知識,以及如何動手編寫智慧型體以執行一系列實際任務。通過閱讀本書,讀者將獲得深層Q網路、策略梯度方法、連續控制問...
《深度強化學習實踐(影印版英文版)》是2019年東南大學出版社出版的圖書,作者是Maxim,Lapan。內容簡介 強化學習(RL)的新發展結合深度學習(DL),在訓練代理以類似人的方式解決複雜問題方面取得了未有的進步。Google使用算法在著名的...
《深度強化學習理論與實踐》是清華大學出版社出版的圖書。內容簡介 本書比較全面、系統地介紹了深度強化學習的理論和算法,並配有大量的案例和編程實現。全書核心內容可以分為3部分,第一部分為經典強化學習,包括第2、3、4章,主要內容...
《深度強化學習原理與實踐》是2019年7月人民郵電出版社出版的圖書,作者是陳仲銘、何明。內容簡介 本書構建了一個完整的深度強化學習理論和實踐體系:從馬爾可夫決策過程開始,根據價值函式、策略函式求解貝爾曼方程,到利用深度學習模擬價值...
《深度強化學習:基於Python的理論及實踐》是2020年12月1日機械工業出版社出版的圖書,作者是勞拉·格雷澤、[Laura、Graesser]、華龍·肯、(Wah...)。內容簡介 這本書是針對計算機科學專業大學生和軟體工程師的。本課程旨在介紹深度強化...
《深度強化學習算法與實踐:基於PyTorch的實現》是2022年4月電子工業出版社出版圖書,作者是張校捷 從基礎理論到項目實踐,詳細介紹新版本PyTorch在強化學習領域中的套用。內容簡介 從強化學習的基礎知識出發,結合PyTorch 深度學習框架,介紹...
《深度強化學習:入門與實踐指南》是2021年機械工業出版社出版的圖書。強化學習是機器學習發展非常迅速的一個領域,由於其靈活性和通用性,可以套用在從玩遊戲到最佳化複雜製造過程的許多實際情況。本書幫助讀者迅速理解深度強化學習,並從原理...
《深度強化學習:基於Python的理論及實踐》是2021年機械工業出版社出版的圖書。內容簡介 深度強化學習結合了深度學習和強化學習,使人工智慧體能夠在沒有監督的情況下學習如何解決順序決策問題。在過去的十年中,深度強化學習在一系列問題上...
《深度強化學習:學術前沿與實戰套用》是2020年機械工業出版社出版的圖書,作者是劉馳,王占健,戴子彭。內容簡介 本書共分為四篇,即深度強化學習、多智慧型體深度強化學習、多任務深度強化學習和深度強化學習的套用。由淺入深、通俗易懂...
深度Q網路是深度強化學習領域的開創性工作。它採用時間上相鄰的4幀遊戲畫面作為原始圖像輸入,經過深度卷積神經網路和全連線神經網路,輸出狀態動作Q函式,實現了端到端的學習控制。深度Q網路使用帶有參數θ的Q函式Q(s, a; θ)去逼近值...
《邊做邊學深度強化學習:PyTorch程式設計實踐》是2020年機械工業出版社出版的圖書。內容簡介 Pytorch是基於python且具備強大GPU加速的張量和動態神經網路,更是Python中優先的深度學習框架,它使用強大的 GPU 能力,提供極高的靈活性和速度。
強化學習的變體包括逆向強化學習、階層強化學習和部分可觀測系統的強化學習。求解強化學習問題所使用的算法可分為策略搜尋算法和值函式(value function)算法兩類。深度學習模型可以在強化學習中得到使用,形成深度強化學習。強化學習理論受到...
《深度強化學習》是2022年人民郵電出版社出版的圖書,作者是王樹森、黎彧君、張志華。 內容簡介 本書基於備受讀者推崇的王樹森“深度強化學習”系列公開視頻課,專門解決“入門深度強化學習難”的問題。本書的獨特之處在於:,知識精簡,...
第 18 章 深度強化學習套用實踐技巧 433 18.1 概覽:如何套用深度強化學習 433 18.2 實現階段 434 18.3 訓練和調試階段 440 總結部分 445 附錄 A 算法總結表 446 附錄 B 算法速查表 451 B.1 深度學習 451 B.1.1 ...
《深度強化學習:原理、算法與PyTorch實戰》是2021年清華大學出版社出版的圖書。內容簡介 本書基於PyTorch框架,用通俗易懂的語言深入淺出地介紹了強化學習的基本原理,包括傳統的強化學習基本方法和目前流行的深度強化學習方法。在對強化學習...
曾就職於德國KUKA Robotics從事協作機器人智慧型套用研發工作,在海康威視研究院任算法專家,負責深度學習、強化學習等領域的創新研究和落地套用,同時也是網際網路社區“深度強化學習實驗室”核心成員,在強化學習套用方面具有豐富的實踐經驗。
近年來,機器學習受到了人們的廣泛關注。本書面向普通大眾,指導讀者在Python(基於Chainer和OpenAI Gym)中實踐深度強化學習。讀者只需要具備一些基本的編程經驗即可讀懂書中內容,通過實現具體程式來掌握深度強化學習的相關知識。本書內容:介...
《Python深度強化學習——使用PyTorch, TensorFlow 和OpenAI》是清華大學出版社於2022年出版的書籍,作者是[印]尼米什·桑吉(Nimish Sanghi)。內容簡介 本書重點突出深度強化學習理論的基本概念、前沿基礎理論和Python套用實現。首先介紹...
《深度強化學習圖解》是2022年清華大學社出版的圖書 ,作者是米格爾·莫拉萊斯(Miguel Morales),譯者是郭濤。內容簡介 我們在與環境互動的過程中進行學習,經歷的獎勵或懲罰將指導我們未來的行為。深度強化學習將該過程引入人工智慧領域,...
第III 部分套用實踐篇 81 第9 章深度強化學習在棋牌遊戲中的套用 83 9.1 棋盤類遊戲 84 9.1.1 AlphaGo: 戰勝人類圍棋冠軍 84 9.1.2 AlphaGo Zero: 不使用人類數據,從頭學習 87 9.1.3 AlphaZero: 從圍棋到...
第五章 深度學習097 5.1 概述 / 099 5.2 神經網路模型 / 101 5.3 神經網路學習方法 / 103 5.4 神經網路的數學解釋 / 106 5.5 本章小結 / 111 第六章 強化學習113 6.1 樸素貝葉斯 / 115 6.2 貝葉斯信念網 / 118 ...
《網路智慧型化中的深度強化學習技術》是2023年人民郵電出版社出版的圖書,作者是戚琦、付霄元、莊子睿、王敬宇、廖建新。內容簡介 隨著人工智慧技術的廣泛套用,網路智慧型化近年來受到廣泛的關注,已經成為下一代移動通信與未來網路的重要技術。
《共融機器人的視覺注意模型及其深度強化學習方法》是依託西安交通大學,由袁澤劍擔任項目負責人的重大研究計畫。中文摘要 機器人環境感知與人機互動是一個複雜的動態感知與行為決策過程。面向複雜任務與動態環境,基於計算機視覺模型的機器人...
《深度學習——從神經網路到深度強化學習的演進》是清華大學出版社於2021年出版的書籍,作者是魏翼飛、汪昭穎、李駿。內容簡介 本書首先概述人工智慧、深度學習相關的基本概念和發展歷程;然後詳細介紹深度學習的基本理論和 算法,包括神經網路...
本書由一線資深技術專家撰寫,凝結了其自身多年的實踐經驗,闡述了深度學習的發展歷程、相關概念和工作原理,介紹了兩個當前流行的深度學習工具:Caffe 和TensorFlow ,並且初步探討了強化學習的基本原理和套用。為了幫助初學者快速上手,本書...
《強化學習與深度學習:通過C語言模擬》以深度學習和強化學習作為切入點,通過原理解析、算法步驟說明、代碼實現、代碼運行調試,對強化學習、深度學習以及深度強化學習進行了介紹和說明。本書共4章。第1章介紹了人工智慧、機器學習、深度...
本書系統地介紹了強化學習的原理和實現,是一本理論紮實、落地性強的圖書。本書包含3個部分:第一部分為強化學習基礎,講解強化學習的基礎概念和表格型強化學習方法;第二部分為強化學習進階,討論深度強化學習的思維方式、深度價值函式和...
《揭秘深度強化學習》是2018年中國水利水電出版社出版的圖書。內容簡介 深度強化學習(Deep Reinforcement Learning,DRL)是深度學習算法和強化學習算法的巧妙結合,它是一種新興的通用人工智慧算法技術,也是機器學習的前沿技術,DRL 算法潛力...
《基於深度強化學習的工業5G動態多優先權多接入方法》是中國科學院瀋陽自動化研究所; 瀋陽智慧型機器人國家研究院有限公司; 瀋陽智慧型機器人創新中心有限公司於2020.05.09申請的專利,該專利的公布號為:CN111628855B,專利公布日:2021...
6.5實踐: 電影評論情感分析 6.5.1數據準備 6.5.2網路結構定義 6.5.3網路訓練 6.5.4網路預測 6.6習題 第7章深度學習進階 7.1深度生成模型 7.1.1變分自編碼器 7.1.2生成對抗網路 7.2深度強化學習 7.2.1強化學習模型...