基於靈敏度分析的可列狀態Markov決策過程的理論研究

中文摘要

Markov系統的性能最佳化理論是處理和解決很多理論領域（運籌學、控制理論、計算科學、經濟學、生物學、通訊網路、金融和排隊理論等）和實際套用系統（通訊（Internet和無線通訊）、生產製造系統、服務管理、金融保險和物流管理等）中的性能評價和最佳化控制問題的一個非常重要的理論基礎。對離散時間有限狀態多鏈的Markov決策過程，從靈敏度分析的角度，對各種的最佳化準則(平均準則，bias準則，nth-bias準則等)，我們得到了非常完整的一套理論結果。本項目的研究內容是同樣用靈敏度分析作為工具來處理可列狀態Markov系統的性能最佳化問題。基於靈敏度分析的方法有很多優點，它可以解決傳統的Markov決策過程解決不了的一些問題,例如行動選擇不獨立於狀態。這種理論還可以把包括擾動分析，Markov決策過程，隨機控制，強化學習等不同的最佳化理論放在統一的框架之下。

基於靈敏度分析的可列狀態Markov決策過程的理論研究

基本介紹

相關詞條

熱門詞條