基於靈敏度分析的可列狀態Markov決策過程的理論研究

基於靈敏度分析的可列狀態Markov決策過程的理論研究

《基於靈敏度分析的可列狀態Markov決策過程的理論研究》是依託中山大學,由張俊玉擔任項目負責人的數學天元基金項目。

基本介紹

  • 中文名:基於靈敏度分析的可列狀態Markov決策過程的理論研究
  • 項目類別:數學天元基金項目
  • 項目負責人:張俊玉
  • 依託單位:中山大學
  • 支持經費:4(萬元)
  • 研究期限:2010-01-01 至 2010-12-31
  • 負責人職稱:副教授
  • 申請代碼:A0601
  • 批准號:10926138
中文摘要
Markov系統的性能最佳化理論是處理和解決很多理論領域(運籌學、控制理論、計算科學、經濟學、生物學、通訊網路、金融和排隊理論等)和實際套用系統(通訊(Internet和無線通訊)、生產製造系統、服務管理、金融保險和物流管理等)中的性能評價和最佳化控制問題的一個非常重要的理論基礎。對離散時間有限狀態多鏈的Markov決策過程,從靈敏度分析的角度,對各種的最佳化準則(平均準則,bias準則,nth-bias準則等),我們得到了非常完整的一套理論結果。本項目的研究內容是同樣用靈敏度分析作為工具來處理可列狀態Markov系統的性能最佳化問題。基於靈敏度分析的方法有很多優點,它可以解決傳統的Markov決策過程解決不了的一些問題,例如行動選擇不獨立於狀態。這種理論還可以把包括擾動分析,Markov決策過程,隨機控制,強化學習等不同的最佳化理論放在統一的框架之下。

相關詞條

熱門詞條

聯絡我們