劉建庸,畢業於中國科技大學數學系,1982年在中國科學院套用數學所工作至今。
基本介紹
- 中文名:劉建庸
- 國籍:中國
- 職業:副研究員
- 畢業院校:中國科技大學
個人簡況,個人簡歷,研究方向,論文論著,
個人簡況
劉建庸,男,副研究員。
個人簡歷
1982年畢業於中國科技大學數學系
1982年在中國科學院套用數學所工作至今
1987年被聘為助研
1992年被聘為副研
現任中國科學院數學與系統科學研究院基地副研究員
1994年香港科技大學信息科學系作訪問研究
1999年香港城市大學管理科學系作訪問研究
研究方向
馬爾可夫決策過程的理論與套用
馬爾可夫決策過程(Markov Decision Processes簡記為MDP),是研究馬爾可夫型隨機序貫決策問題的一門學科,它既是隨機運籌學的一門分支,也是套用機率的一門分支,同時,作為馬爾可夫型系統最優控制的理論,它亦屬於隨機系統最優控制領域,MDP與近年來興起的計算機集成製造系統中的系統理論與離散事件動態系統理論密切相關。
馬爾可夫決策過程的套用領域十分廣泛,這些領域包括:生產存貯系統、供應鏈系統、設備更換/維修、製造系統的調度控制、計算機通信網路系統控制、動態資產定價、廣告最佳化、商品與服務的定價、質量控制、水資源管理、森林管理、高速公路管理等。
論文論著
"ON AVERAGE REWARD SEMI-MARKOV DECISION PROCESSES WITH A GENERAL MULTICHAIN STRUCTURE", Math. Oper. Res., 待發表。
(2003) "NECESSARY CONDITIONS FOR CONTINUOUS TIME MARKOV DECISION PROCESSES WITH EXPECTED DISCOUNT TOTAL REWARDS", Inter. Jour. Pure and Appl. Math., Vol.7, No.2, 147-175.
(2002) "Notes on Average Markov Decision Processes with a Minimum-Variance Criterion", Oper. Res. Letters, Vol.30, No.2, 107-116.
(2002) "On dispatching unequally capable service technicians",IMA Jour. Mana. Math., 13, 153-165.
(2001) "Markov Decision Processes with Distribution Function Criterion of First Passage Time", Appl. Math. Optim., 43, 187-201.
(2000) "Nonhomogeneous Markov Decision Processes with Borel State Space--The Average Criterion with Nonuniformly Bounded Rewards", Math. Oper. Res., Vol. 25, p667-678.
(2000) 馬爾可夫決策過程引論,西安電子科技大學出版社。(with 胡奇英)
(1999) 馬氏決策規劃,運籌學基礎手冊,徐光輝,科學出版社。
(1999) "非平穩MDP平均模型及其滾動式算法", 系統科學與數學, Vol. 19(4): pp439-446
(1997) “Markov Decision Programming-the Moment optimal problem for the first-passage model”, J. Australia Math. Soci. Ser. B: Appl. Math., 38, 542-562.
(1997) “On optimal strategy of discounted Markov stochastic games”, SEA. Bull. Math., 21, pp15-25.
(1996) “On discounted Markov decision programming with multi-vector constraints”, Chinese Scinece Bull., Vol.41, No.3, pp202-207.
(1995) "Average Reward Markov Decision Programming with Accountable Action Set", SEA Bull. Math., 19(1):87-93.
(1994) "Markov Decision Programming with Constraints", Acta Mathematicae Applicatae Sinica, 10(1):1-11.
(1994) "An Algorithm on the Gittins Index", Systems Science and Mathematical Sciences, 7(2):106-114.
(1993) "部分可觀察馬爾可夫決策規劃---首達目標模型", 套用數學學報, 17卷1期:44-58.
(1993) "隨機折扣部分可觀察馬爾可夫決策規劃", 系統科學與數學, 13(2):152-159.
(1993) "無限時段部分可觀察馬爾可夫決策規劃", Appl. J. Chinese Uni.,8(2):208-221.
(1992) "Optimal Policies about Discounted Vector-valued Markovian Decision Programming and Its Algorithms", SEA Bull. Math.,16(2):135-141.
(1992) "Markov Decision Programming-The First Passage Model with Denumerable State Space", Sys. Sci. and Math. Scis., 5(4):340-351.
(1992) "Bellman's Optimal Principle in Average Cost Problem",SEA Bull. Math., 16(1):71-80.
(1991) "Vector-valued Semi-Markovian Decision Programming", Chinese Science Bulletin, 36(13):1065-1069.
(1991) "關於Tijms等的算法收斂性",數理統計與套用機率,(4):521-526.
(1990) "On Markovian Decision Programming with Recursive Reward Functions", Ann. Operations Research, 24:145-164.
(1990) "Markovian Decision Programming with Recursive Vector-reward", Acta Math. Appl. Sinica, 6(2):158-165.