劉建庸

個人簡況

劉建庸，男，副研究員。

個人簡歷

1982年畢業於中國科技大學數學系

1982年在中國科學院套用數學所工作至今

1987年被聘為助研

1992年被聘為副研

現任中國科學院數學與系統科學研究院基地副研究員

1994年香港科技大學信息科學系作訪問研究

1999年香港城市大學管理科學系作訪問研究

研究方向

馬爾可夫決策過程的理論與套用

馬爾可夫決策過程（Markov Decision Processes簡記為MDP），是研究馬爾可夫型隨機序貫決策問題的一門學科，它既是隨機運籌學的一門分支，也是套用機率的一門分支，同時，作為馬爾可夫型系統最優控制的理論，它亦屬於隨機系統最優控制領域，MDP與近年來興起的計算機集成製造系統中的系統理論與離散事件動態系統理論密切相關。

馬爾可夫決策過程的套用領域十分廣泛，這些領域包括：生產存貯系統、供應鏈系統、設備更換/維修、製造系統的調度控制、計算機通信網路系統控制、動態資產定價、廣告最佳化、商品與服務的定價、質量控制、水資源管理、森林管理、高速公路管理等。

論文論著

"ON AVERAGE REWARD SEMI-MARKOV DECISION PROCESSES WITH A GENERAL MULTICHAIN STRUCTURE", Math. Oper. Res., 待發表。

(2003) "NECESSARY CONDITIONS FOR CONTINUOUS TIME MARKOV DECISION PROCESSES WITH EXPECTED DISCOUNT TOTAL REWARDS", Inter. Jour. Pure and Appl. Math., Vol.7, No.2, 147-175.

(2002) "Notes on Average Markov Decision Processes with a Minimum-Variance Criterion", Oper. Res. Letters, Vol.30, No.2, 107-116.

(2002) "On dispatching unequally capable service technicians",IMA Jour. Mana. Math., 13, 153-165.

(2001) "Markov Decision Processes with Distribution Function Criterion of First Passage Time", Appl. Math. Optim., 43, 187-201.

(2000) "Nonhomogeneous Markov Decision Processes with Borel State Space--The Average Criterion with Nonuniformly Bounded Rewards", Math. Oper. Res., Vol. 25, p667-678.

劉建庸

基本介紹

個人簡況

個人簡歷

研究方向

論文論著

相關詞條

熱門詞條