《強化學習》是一本2018年機械工業出版社出版的圖書,作者還是[荷] 馬可·威寧(Marco Wiering),馬丁·范·奧特羅(Martijn van Otterlo)。本書詳細介紹了強化學習中各領域的基本理論和新進展。
基本介紹
- 書名:強化學習
- 作者:[荷] 馬可·威寧(Marco Wiering)、馬丁·范·奧特羅(Martijn van Otterlo)
- 出版社:機械工業出版社
- ISBN:9787111600220
《強化學習》是一本2018年機械工業出版社出版的圖書,作者還是[荷] 馬可·威寧(Marco Wiering),馬丁·范·奧特羅(Martijn van Otterlo)。本書詳細介紹了強化學習中各領域的基本理論和新進展。
強化學習(Reinforcement Learning, RL),又稱再勵學習、評價學習或增強學習,是機器學習的範式和方法論之一,用於描述和解決智慧型體(agent)在與環境的互動過程中通過學習策略以達成回報最大化或實現特...
深度強化學習將深度學習的感知能力和強化學習的決策能力相結合,可以直接根據輸入的圖像進行控制,是一種更接近人類思維方式的人工智慧方法。簡介 深度學習具有較強的感知能力,但是缺乏一定的決策能力;而強化學習具有決策能力,對感知問題束...
強化不論正負,有時可以是迅速產生並導致顧客產生行為反應,有時也可能是逐漸發生與逐漸加強。負強化的逐漸加強可以稱為消退或削弱。在某種條件下,誘因與學習的條件逐漸削弱、淡化乃至消失,顧客不再產生某種行為了,這個過程就是消退。例...
《強化學習(第2版)》是2019年9月電子工業出版社出版的圖書,作者是俞凱。內容簡介 《強化學習(第2版)》作為強化學習思想的深度解剖之作,被業內公認為是一本強化學習基礎理論的經典著作。它從強化學習的基本思想出發,深入淺出又...
《強化學習:原理與Python實戰》是2023年機械工業出版社出版的圖書。內容簡介 本書從原理和實戰兩個方面介紹了強化學習。原理方面,深入介紹了主流強化學習理論和算法,覆蓋資格跡等經典算法和MuZero等深度強化學習算法;實戰方面,每章都配套...
學習的強化,強化是指一件事物提高了某一刺激所引起的反應出現的機率,使之在同樣條件下再度發生;從神經機制說,是指一個神經過程增強了另一神經過程的強度和效應。在И.Π.巴甫洛夫的條件反射學說中,強化是指條件反射形成過程中使無...
《強化學習》是2020年清華大學出版社出版的圖書。本書內容系統全面,覆蓋面廣,既有理論闡述、公式推導,又有豐富的典型案例,理論聯繫實際。書中全面系統地描述了強化學習的起源、背景和分類,各類強化學習算法的原理、實現方式以及各算法...
《強化學習》是一本2018年機械工業出版社出版的圖書,作者還是[荷] 馬可·威寧(Marco Wiering),馬丁·范·奧特羅(Martijn van Otterlo)。本書詳細介紹了強化學習中各領域的基本理論和新進展。內容簡介 《強化學習》共有19章,分為...
《強化學習》是清華大學出版社於2019年12月1日出版的圖書,作者是柯良軍、王小強。內容簡介 本書介紹強化學習原理、算法及其實現。內容涉及基於模型的強化學習、基於採樣-估計的強化學習、基於逼 近理論的強化學習及深度強化學習等。本書以...
《強化學習:前沿算法與套用》是2023年機械工業出版社出版的圖書。內容簡介 強化學習是機器學習的重要分支,是實現通用人工智慧的重要途徑。本書介紹了強化學習在算法層面的快速發展,包括值函式、策略梯度、值分布建模等基礎算法,以及為了...
《強化學習:原理與Python實現》是一部理論完備,涵蓋主流經典強化學習算法和深度強化學習算法,並配套理論基礎和性能分析的著作,由機械工業出版社出版。內容簡介 本書理論完備,涵蓋主流非深度強化學習算法和深度強化學習算法;實戰性強,...
《強化學習原理及其套用》是2014年6月1日科學出版社出版的圖書,作者是王雪松、朱美強、程玉虎。內容簡介 作為一類求解序貫最佳化決策問題的有效方法,強化學習在運籌學、計算科學和自動控制等領域得到廣泛套用,業已成為機器學習領域活躍的研究...
《深度強化學習圖解》是2022年清華大學社出版的圖書 ,作者是米格爾·莫拉萊斯(Miguel Morales),譯者是郭濤。內容簡介 我們在與環境互動的過程中進行學習,經歷的獎勵或懲罰將指導我們未來的行為。深度強化學習將該過程引入人工智慧領域,...
《深度強化學習算法與實踐:基於PyTorch的實現》是2022年4月電子工業出版社出版圖書,作者是張校捷 從基礎理論到項目實踐,詳細介紹新版本PyTorch在強化學習領域中的套用。內容簡介 從強化學習的基礎知識出發,結合PyTorch 深度學習框架,介紹...
《深度強化學習原理與實踐》是2019年7月人民郵電出版社出版的圖書,作者是陳仲銘、何明。內容簡介 本書構建了一個完整的深度強化學習理論和實踐體系:從馬爾可夫決策過程開始,根據價值函式、策略函式求解貝爾曼方程,到利用深度學習模擬價值...
《量子強化學習理論、算法及套用》是依託浙江大學,由董道毅擔任項目負責人的青年科學基金項目。項目摘要 設計快速高效的學習算法是人工智慧中的一個關鍵問題,強化學習是機器學習領域的一種重要學習方法。項目以自主移動機器人學習和量子系統...
《強化學習精要:核心算法與TensorFlow實現》是2018年4月電子工業出版社出版的圖書,作者是馮超。內容簡介 《強化學習精要:核心算法與TensorFlow 實現》用通俗幽默的語言深入淺出地介紹了強化學習的基本算法與代碼實現,為讀者構建了一個...
強化學習預測法 強化學習預測法(reinforce learning forecasting model )是2016年公布的管理科學技術名詞。定義 利用某一表示“獎/懲”的全局信號而進行學習的預測方法。出處 《管理科學技術名詞》第一版。
《深度強化學習:原理、算法與PyTorch實戰》是2021年清華大學出版社出版的圖書。內容簡介 本書基於PyTorch框架,用通俗易懂的語言深入淺出地介紹了強化學習的基本原理,包括傳統的強化學習基本方法和目前流行的深度強化學習方法。在對強化學習...
《基於事件的強化學習及其在群機器人最佳化控制中的套用》是依託南京大學,由陳春林擔任項目負責人的面上項目。項目摘要 強化學習是實現智慧型系統的一項關鍵技術,利用問題的結構信息設計分層學習算法是克服複雜問題維數災難、提高學習速度的有效...
《強化學習關鍵技術及其在機器人行為學習中的套用》是依託中國礦業大學,由程玉虎擔任項目負責人的面上項目。項目摘要 針對強化學習存在的基函式選取困難、學習速度慢及算法收斂性難以保證等問題,設計一類有效的強化學習控制方法,並將其套用...
《用python動手學強化學習(全彩印刷)》是人民郵電出版社2021年7月出版的書籍,該書結合實際可運行的Python代碼,通過簡明的文字、豐富的插圖和示例,通俗易懂地介紹了從基礎概念到前沿套用等方方面面的內容,包括根據環境和經驗制訂計畫的...
《深度強化學習理論與實踐》是清華大學出版社出版的圖書。內容簡介 本書比較全面、系統地介紹了深度強化學習的理論和算法,並配有大量的案例和編程實現。全書核心內容可以分為3部分,第一部分為經典強化學習,包括第2、3、4章,主要內容...
《Reinforcement Learning for Sequential Decision and Optimal Control》是2023年由Springer出版的強化學習英文書籍。本書面向工程領域的科研人員和工程師,按照原理剖析、主流算法、典型示例的架構,介紹用於複雜系統動態決策及最優控制的強化...