隨機對策的首達目標準則及其有限逼近

項目摘要

現有文獻對隨機對策的理論研究集中在最佳化區間無限和折扣因子為常數的情形，而在實際生活中很多對策問題的最佳化區間是隨機的(如競賽取勝的時間)、折扣因子是不確定的(如銀行的利率)。此外，隨著套用的推廣，計算已成為隨機對策的熱點問題。本項目擬在已有工作的基礎上，對隨機對策的理論與計算兩大方面展開研究。理論研究集中於探索隨機對策的首達目標期望折扣賠付準則，其中最佳化區間是隨機的且折扣因子依賴狀態，試圖尋找納什均衡存在的條件及分析主要結果的套用，這是當前常數折扣因子和最佳化區間無限的隨機對策的延伸和拓展。眾所周知，有限模型的計算易於狀態可數情形，針對上述首達目標準則，本項目的計算研究包括：(1) 設計有限模型下鞍點的計算方法；(2) 運用逼近技巧進一步尋求可數狀態模型下鞍點的近似計算方法。這些研究內容在隨機對策中是新的，不僅能推進隨機對策理論的新進展，而且能深化隨機對策理論的套用，有利於理論指導實踐。

結題摘要

本項目主要研究隨機對策首達目標準則的相關問題，具體如下：(1) 首達目標均值-方差折扣準則最優值函式和最優策略的存在性及計算方法。對該準則下的最佳化問題，在半馬氏決策過程（即只有一個局中人的半馬氏隨機對策）的框架下，我們建立了最優方程解的存在唯一性，基於此證明了最優策略的存在性，並提供了計算最優策略的策略改進算法和最優值函式的疊代算法。相應結果發表在學術期刊Kybernetika上。 (2) 首達目標期望折扣賠付準則值函式和鞍點的存在性條件及值函式的逼近方法。對該準則下的最佳化問題，在離散時間兩人零和隨機對策的框架下，建立了Shapley方程，得到了值函式和鞍點存在的條件，給出了近似計算值函式的疊代算法、誤差估計和策略對是鞍點的兩個等價條件。相應結果發表在學術期刊Optimization上。上述(1)是諾貝爾經濟學獎獲得者Markowitz均值-方差投資組合問題在半馬氏決策過程中的發展，上述(2)首次將折扣因子變動的折扣準則拓展到了兩人零和隨機對策模型中。

隨機對策的首達目標準則及其有限逼近

基本介紹

項目摘要

結題摘要

熱門詞條