連續時間馬氏決策過程受約束問題的研究

項目摘要

馬氏決策過程在眾多領域有著廣泛的套用，如金融保險、通信網路、庫存管理、可靠性理論等。現實世界中的許多套用問題涉及到的時間總是有限的，研究馬氏決策過程的有限階段問題在理論上和套用上都具有重要的意義。本項目擬研究連續時間馬氏決策過程的受約束問題：(1)有限階段期望準則的多約束問題，其中目標函式和約束函式均為有限階段期望總效益；(2)有限階段總效益的均值-方差問題，即在有限階段總效益的均值等於某一常數的策略類中尋找使得有限階段總效益的方差最小的策略。我們將研究上述問題最優策略的存在性和計算方法這兩個核心的理論問題。本項目的研究不僅能豐富隨機動態系統的最最佳化理論，而且為馬氏決策模型的套用研究奠定理論基礎。

結題摘要

本項目主要研究連續時間馬氏決策過程的有限階段問題，具體如下：（1）有限階段期望準則最優值函式和最優策略的計算方法。關於該準則，給出了計算最優值函式和最優策略的有限逼近算法，得到了相應的誤差估計式，證明了該算法的收斂性。相應結果發表在國際學術期刊4OR-A Quarterly Journal of Operations Research上。（2）風險靈敏性有限階段準則最優策略的存在性條件和計算方法。關於該準則，給出了最優策略的存在性條件，得到了轉移率無界情形的連續時間馬氏決策過程的Feynman-Kac公式，建立了最優方程解的存在唯一性，證明了最優策略的存在性，給出了近似計算最優值函式和最優策略的值疊代算法和相應的誤差估計式。相應結果發表在國際學術期刊Mathematical Methods of Operations Research上。本項目給出了近似計算最優值函式和最優策略的新算法，為馬氏決策模型的套用研究奠定了算法基礎。

連續時間馬氏決策過程受約束問題的研究

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條