人物簡介
郭先平教授從事馬爾可夫決策過程(Markov Decision Processes, 簡記為 MDPs)和隨機動態對策的理論和套用研究。其專著《馬爾可夫決策過程》(與侯振挺教授合作)“填補了中國在此領域的空白”(見1999年《科學通報》中的書評),並與香港科技大學X.-R. Cao教授,墨西哥CINVESTAV-IPN O. Hernandez-Lerma教授, 澳大利亞South Australia 大學J. A. Filar教授等合作,在部分可觀察的MDPs和擾動分析,連續時間MDPs和隨機對策,非平穩MDPs和排隊系統的最優控制等方面的研究取得系列重要進展。
主要成就
主要成果已發表在國際權威刊物Ann. Appl. Probab., IEEE Trans. Autom. Control, SIAM J. Optim.,SIAM J. Control Optima.,Math. Oper. Res.,J. Appl. Probab.,Automatica,Bernoulli,Acta Appl. Math.和《科學通報》等上。這些研究成果主要體現在以下方面:
(1) 創立了離散時間非平穩MDPs平均模型的最優方程,否定了著名學者的相關論點;
(2) 實質性推進了連續時間MDP理論和套用研究的新進展, 回答了著名學者的有關問題;
(3) 首次建立了連續時間Markov隨機對策的機率論基礎,, 豐富了隨機對策的研究內容.
上述研究成果是豐富而深刻的,研究方法是創新而有趣的。