《基於靈敏度分析的可列狀態Markov決策過程的理論研究》是依託中山大學,由張俊玉擔任項目負責人的數學天元基金項目。
基本介紹
- 中文名:基於靈敏度分析的可列狀態Markov決策過程的理論研究
- 項目類別:數學天元基金項目
- 項目負責人:張俊玉
- 依託單位:中山大學
- 支持經費:4(萬元)
- 研究期限:2010-01-01 至 2010-12-31
- 負責人職稱:副教授
- 申請代碼:A0601
- 批准號:10926138
中文摘要
Markov系統的性能最佳化理論是處理和解決很多理論領域(運籌學、控制理論、計算科學、經濟學、生物學、通訊網路、金融和排隊理論等)和實際套用系統(通訊(Internet和無線通訊)、生產製造系統、服務管理、金融保險和物流管理等)中的性能評價和最佳化控制問題的一個非常重要的理論基礎。對離散時間有限狀態多鏈的Markov決策過程,從靈敏度分析的角度,對各種的最佳化準則(平均準則,bias準則,nth-bias準則等),我們得到了非常完整的一套理論結果。本項目的研究內容是同樣用靈敏度分析作為工具來處理可列狀態Markov系統的性能最佳化問題。基於靈敏度分析的方法有很多優點,它可以解決傳統的Markov決策過程解決不了的一些問題,例如行動選擇不獨立於狀態。這種理論還可以把包括擾動分析,Markov決策過程,隨機控制,強化學習等不同的最佳化理論放在統一的框架之下。