《基於核的增強學習與近似動態規劃方法研究》是依託中國人民解放軍國防科技大學,由徐昕擔任項目負責人的面上項目。
基本介紹
- 中文名:基於核的增強學習與近似動態規劃方法研究
- 項目類別:面上項目
- 項目負責人:徐昕
- 依託單位:中國人民解放軍國防科技大學
- 批准號:60774076
- 申請代碼:F0301
- 負責人職稱:研究員
- 研究期限:2008-01-01 至 2010-12-31
- 支持經費:25(萬元)
《基於核的增強學習與近似動態規劃方法研究》是依託中國人民解放軍國防科技大學,由徐昕擔任項目負責人的面上項目。
《基於核的增強學習與近似動態規劃方法研究》是依託中國人民解放軍國防科技大學,由徐昕擔任項目負責人的面上項目。中文摘要增強學習(reinforcement learning)是來源於人腦自評價(adaptive criti...
《增強學習與近似動態規劃》是2010年科學出版社出版的一本圖書,作者是徐昕。本書對增強學習與近似動態規劃的理論、算法及套用進行了深入研究和論述。內容簡介 主要內容包括:求解Markov鏈學習預測問題的時域差值學習算法和理論,求解連續空間...
2.4 批處理強化學習算法 37 2.4.1 基於核的近似動態規劃 37 2.4.2 擬合Q疊代 39 2.4.3 基於小二乘的策略疊代 40 2.4.4 識別批處理算法 41 2.5 批處理強化學習理論 42 2.6 批處理強化學習的實現 43...
《基於函式逼近的強化學習與動態規劃》是2019年人民郵電出版社出版的圖書,作者是盧西恩·布索尼、羅伯特·巴布斯卡、巴特·德·舒特、達米安·厄恩斯特。內容簡介 本書討論大規模連續空間的強化學習理論及方法,重點介紹使用函式逼近的強化...
自適應動態規劃(Adaptive/Approximate Dynamic Programming,ADP),又近似動態規劃,是人工智慧和控制領域發展而交匯形成的新興學科。ADP方法主要包括三種基本類型:啟發式動態規劃(Heuristic Dynamic Programming,HDP),雙啟發式動態規劃(Dual ...
《基於深度學習與動態規劃的街景影像文本信息提取研究》是依託武漢大學,由劉菊華擔任項目負責人的青年科學基金項目。項目摘要 街景影像作為攝影測量系統的基礎數據之一,包含了許多重要的文本信息,這些具有明確語義的文本信息是描述與理解影像...
本書討論依賴於近似的解決方法,以產生具有足夠性能的次優策略。這些方法統稱為增強學習,也可以叫做近似動態規劃和神經動態規劃等。 本書的主題產生於*控制和人工智慧思想的相互作用。本書的目的之一是探索這兩個領域之間的共同邊界,並...
第8章 整合學習與規劃 187 8.1 基於模型的強化學習概述 188 8.1.1 基於模型的強化學習 188 8.1.2 基於模型的優點 188 8.1.3 基於模型的缺點 189 8.2 學習與規劃 189 8.2.1 學習過程 189 8.2.2 規划過程...
本書重點突出深度強化學習理論的基本概念、前沿基礎理論和Python套用實現。首先介紹馬爾可夫決策、基於模型的算法、無模型方法、動態規劃、蒙特卡洛和函式逼近等基礎知識;然後詳細闡述強化學習、深度強化學習、多智慧型體強化學習等算法,及其Python...
研究方法:博弈模型、動態規劃、仿真最佳化、強化學習 研究領域:共享經濟、庫存管理、醫療管理、消費者行為、運作-行銷交叉 科研項目 1. 2023-2026 國家自然科學基金面上項目,考慮患者等待時長的醫療系統預約調度研究:基於近似動態規劃的...
所涉及的知識點包括馬爾科夫決策、蒙特卡洛學習、時序差分學習、函式近似法、策略梯度法、近似動態規劃、深度強化學習等。希望本書的出版將為領域內的行業同仁,包括本科生、研究生以及技術人員,提供一本體系較為完整、內容較為全面、講解...
《連續、不連續以及離散動態系統的穩定性》《網路控制系統:理論及套用》《混沌控制:抑制、同步以及混沌化》《神經網路進展:ISNN2011》《腦啟發認知系統進展:BICS2012》《自適應動態規劃-控制算法與穩定性》《強化學習與近似動態規劃》《...