馬氏決策規劃是在賦值馬氏過程中,如果在某狀態選用不同的決策能夠改變相應的狀態轉移矩陣及報酬矩陣所產生的動態隨機系統求最優策略的問題的解決方法。根據報酬函式和目標函式的不同,建立了不同類型的最佳化模型,如有限階段模型、折扣模型、平均模型和無界報酬模型等。
基本介紹
- 中文名:馬氏決策規劃
- 定義:在賦值馬氏過程中,如果在某狀態選用不同的決策能夠改變相應的狀態轉移矩陣及報酬矩陣所產生的動態隨機系統求最優策略的問題的解決方法
馬氏決策規劃是在賦值馬氏過程中,如果在某狀態選用不同的決策能夠改變相應的狀態轉移矩陣及報酬矩陣所產生的動態隨機系統求最優策略的問題的解決方法。根據報酬函式和目標函式的不同,建立了不同類型的最佳化模型,如有限階段模型、折扣模型、平均模型和無界報酬模型等。
馬氏決策規劃是在賦值馬氏過程中,如果在某狀態選用不同的決策能夠改變相應的狀態轉移矩陣及報酬矩陣所產生的動態隨機系統求最優策略的問題的解決方法。根據報酬函式和目標函式的不同,建立了不同類型的最佳化模型,如有限階段模型、折扣模...
《馬氏決策規劃一些新模型的研究》是依託中國科學院數學與系統科學研究院,由劉建庸擔任項目負責人的面上項目。項目摘要 本項目我們共完成和發表論文27篇,其中發表和已接受發表的論文有13篇(其中國內外核心刊物的論文有9篇)。出版專著...
研究基於層次嵌套馬氏決策模型的應急決策;將應急處置任務的時間、資源約束以及協調機制引入馬氏決策規劃,研究基於多主體協調機制的應急決策規劃方法;以效用理論為基礎,並將風險效用函式引入馬氏決策規劃,研究風險敏感的應急決策規劃方法。
馬爾可夫決策規劃 馬爾可夫決策規劃(Markov decision programming)是1993年公布的數學名詞。公布時間 1993年,經全國科學技術名詞審定委員會審定發布。出處 《數學名詞》第一版。
《馬爾可夫決策過程理論與套用》是2015年科學出版社出版的圖書,作者是劉克、曹平。內容簡介 馬爾可夫決策過程理論與套用 馬氏決策過程是研究多階段決策問題的一種方法,其基本思想是著重於決策過程的形象化描述,包括有:決策時刻、系統狀態、...
《馬氏決策過程理論及其在基因調控網路中的套用》是依託華南師範大學,由劉秋麗擔任項目負責人的青年科學基金項目。項目摘要 過去對離散時間馬氏過程的首達目標準則的理論研究僅局限在狀態空間可數、行動空間有限且報酬有界的情形。另一方面,...
《基於覆蓋數的部分可觀察不確定性規劃理論及方法》是依託蘇州大學,由章宗長擔任項目負責人的青年科學基金項目。項目摘要 部分可觀察馬氏決策過程(簡稱POMDP)為智慧型體在隨機環境中的不確定性規劃問題提供了一個通用的數學模型。POMDP規劃...
《動態格序決策理論與方法研究》是依託四川大學,由郭春香擔任項目負責人的面上項目。項目摘要 在靜態格序決策理論與套用前期研究成果的基礎上,針對動態不確定環境的特點,運用格論、動態規劃、馬氏決策、隨機過程和圖論等工具,研究動態格序...
此外MDP存在一些變體,包括部分可觀察馬爾可夫決策過程、約束馬爾可夫決策過程和模糊馬爾可夫決策過程。在套用方面,MDP被用於機器學習中強化學習(reinforcement learning)問題的建模。通過使用動態規劃、隨機採樣等方法,MDP可以求解使回報最大化...
例如,基於點的方法對隨機可達信念點進行抽樣,以將規劃約束到信念空間中的相關區域。還探索了使用PCA降低尺寸的方法。討論 由於代理不直接觀察環境的狀態,因此代理必須在真實環境狀態的不確定性下做出決策。然而,通過與環境互動並接收觀察...
靜態決策 靜態決策(static decision-making)是2016年經全國科學技術名詞審定委員會審定發布的管理科學技術名詞。定義 針對不包含時間因素的決策問題做出的一次性決策。出處 《管理科學技術名詞》
第2章 規劃擴展 2.1 整數規劃 2.2 非線性規劃 2.3 目標規劃 2.4 實際套用 第3章 決策技術 3.1 不定決策 3.2 風險決策 3.3 序列決策 3.4 效用函式 3.5 馬氏決策 3.6 多屬性決策 3.7 群決策 3.8 實際套用 第4...
(1999) 馬氏決策規劃,運籌學基礎手冊,徐光輝,科學出版社。(1999) "非平穩MDP平均模型及其滾動式算法", 系統科學與數學, Vol. 19(4): pp439-446 (1997) “Markov Decision Programming-the Moment optimal problem for the first-...
考慮顧客等待時間的方差作為衡量方差的指標,研究基於方差的馬氏決策過程(MDP)最佳化理論,由於方差所具有的非線性和不可加性,導致該動態最佳化問題不屬於標準的馬氏決策過程模型,經典動態規劃理論無法適用,我們從基於性能靈敏度最佳化理論出發,...
161 一、 馬氏決策規劃簡介 163 二、 馬氏決策規劃在風險管理決策中 的套用 165 本章重要概念 166 思考題 167 第十一章 現金流量分析 167 ★本章知識結構 ★本章學習目標 167 第一節 現金流量分析作為決策標準 168 ...
像20世紀20年代出現的積分回歸,30年代出現的柯爾莫果洛夫檢驗,40年代出現的蒙特卡羅方法,50、60年代出現的逐步回歸方法、模糊數學,70年代出現的改進車貝雪夫多項式、均勻設計,80年代出現的灰色控制系統、馬氏決策規劃、可拓邏輯,90年代...
第二是馬氏決策過程:從單階段決策和動態規劃引入馬氏決策過程,包括有限階段、無限階段折扣和平均準則,及其在多個領域的套用。第三是庫存論:連續時間EOQ及其推廣、非時齊庫存模型;隨機模型中的報童模型,有初始庫存的情形,多階段庫存...
第七章 動態規劃 第一節 多階段決策過程的最最佳化 第二節 動態規劃的基本概念和基本原理 第三節 動態規劃模型的建立與求解 第四節 動態規劃在經濟管理中的套用 第五節 馬氏決策規劃簡介 習題 第八章 圖與網路分析 第一節 圖與網路...
第七章 動態規劃 第一節 多階段決策過程的最最佳化 第二節 動態規劃的基本概念和基本原理 第三節 動態規劃模型的建立與求解 第四節 動態規劃在經濟管理中的套用 第五節 馬氏決策規劃簡介 習題 第八章 圖與網路分析 第一節 圖...
第七章動態規劃 第一節多階段決策過程的最最佳化 第二節動態規劃的基本概念和基本原理 第三節動態規劃模型的建立與求解 第四節動態規劃在經濟管理中的套用 第五節馬氏決策規劃簡介 習題 第八章圖與網路分析 第一節圖與網路的基本知識 ...
1.1 不定決策 1.2 風險決策 1.3 效用函式 1.4 序列決策 1.5 敏感分析 1.6 馬氏決策 1.7 多屬性決策 習題 第2章 網路計畫 2.1 確定型網路圖 2.2 機率型網路圖 2.3 網路圖的最佳化 習題 第3章 線性規劃 3.1 規劃...
本項目首先針對單次的醫療服務,包括門診或檢查,基於馬氏決策過程和隨機規劃等方法,考慮了患者不同的等待時間要求,探討了關鍵醫療資源的配置決策最佳化與患者的提前調度與預約調度;針對重入的醫療服務,如放療或住院,將時間槽作為伺服器,...