《馬氏決策過程的理論與套用》是依託中山大學,由郭先平擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:馬氏決策過程的理論與套用
- 項目類別:青年科學基金項目
- 項目負責人:郭先平
- 依託單位:中山大學
- 批准號:19901038
- 申請代碼:A0209
- 負責人職稱:教授
- 研究期限:2000-01-01 至 2002-12-31
- 支持經費:5(萬元)
《馬氏決策過程的理論與套用》是依託中山大學,由郭先平擔任項目負責人的青年科學基金項目。
POMDP是一個馬爾可夫決策過程的泛化。POMDP與MDP的馬爾可夫性質相同,但是POMDP框架下智慧型體只能知道部分狀態的觀測值。比如在自動駕駛中,智慧型體只能感知感測器採集的有限的環境信息。與MDP相比,POMDP包含兩個額外的模型要素:智慧型體的觀測機率 和觀測空間 。套用 作為強化學習的模型,MDP適用於很多與強化學習有關的實際...
《馬氏決策過程的理論與套用》是依託中山大學,由郭先平擔任項目負責人的青年科學基金項目。中文摘要 本項目將研究三方面的內容:1、馬爾科夫決策過程新的最優性條件和算法;2、馬爾科夫決策過程的參數估計和攝動理論;3、特殊模型的計算機模擬和套用。本項目具有前沿性和開蔥裕雜詿俳磯品蚓霾吖湯礪酆圖撲愕...
《馬氏決策過程理論及其在基因調控網路中的套用》是依託華南師範大學,由劉秋麗擔任項目負責人的青年科學基金項目。項目摘要 過去對離散時間馬氏過程的首達目標準則的理論研究僅局限在狀態空間可數、行動空間有限且報酬有界的情形。另一方面,馬氏決策過程在實際中的套用研究已經深入到很多領域,但其在基因調控網方面的套用...
1.1.8平穩分布的套用 1.2連續時間馬爾可夫鏈 1.2.1兩個狀態的連續時間馬爾可夫鏈 1.3求解線性系統的疊代法 1.3.1有關矩陣理論的一些結論 1.3.2矩陣分裂 1.3.3經典的疊代法 1.3.4譜半徑 1.3.5逐次超鬆弛方法 1.3.6共軛梯度法 1.3.7特普利茨矩陣 1.4隱馬爾可夫模型 1.5馬爾可夫決策過程 1....
,通常也簡稱為馬氏決策過程. 馬氏決策過程的理論在最近的幾十年中得到了長足的發展. 作為從20世紀50年代產生的運籌學的一個分支,馬氏決策過程的模型已經在生態科學、經濟理論、通訊工程以及眾多學科中得到了廣泛的套用,而這些新的套用也為其帶來了豐富的理論研究內容.例如:近期利用攝動馬氏決策過程的相關理論,分析...
《隨機過程的最優控制、穩定性理論及其套用研究》是朱全新為項目負責人,寧波大學為依託單位的青年科學基金項目。科研成果 項目摘要 在隨機過程的最優控制理論中,連續時間馬氏決策過程(CTMDP)最近在國際上被廣泛研究並取得了一些好結果。但大多數研究都只限於有限或可數狀態空間情形。當狀態空間非可數時,研究存在相當大...
《馬氏決策過程若干模型的研究》是依託清華大學,由林元烈擔任項目負責人的面上項目。項目摘要 首次研究首達目標總報酬隨機序最優模型,在理論分析與算法方面取得重要進展,同行認為在MDP中提出了一種重要的新的最佳化問題;對摺扣報酬的機率準則與最小風險模型提出了一個新的模型框架、解決了多年來未解決的難題:最優...
《基於公平指標的排隊系統最佳化理論及套用》是依託中山大學,由夏俐擔任項目負責人的面上項目。中文摘要 公平性是排隊系統的重要性能指標,可用方差等指標來衡量,但由於方差等公平指標涉及高階統計量,而傳統排隊論大多研究平均指標等一階統計量,難以處理基於公平指標的性能分析和最佳化問題。馬氏決策過程(MDP)是排隊系統...
本項目主要研究逐段決定馬爾可夫過程及其在金融保險中的套用,屬於隨機過程理論與金融保險套用的交叉研究。最近幾十年,隨著金融保險事業的蓬勃發展,具有平穩獨立增量性質的古典風險模型越來越不適合時代的發展。為了使模型更貼近於實際套用,我們採用逐段決定馬爾可夫過程來刻畫保險公司的盈餘過程。本項目中,我們將主要研究...
神經網路廣泛套用於各個領域,並獲得相當成功。但對於馬氏切換隨機神經網路動態性研究尚處於起步階段。利用Lyapunov理論、複雜性理論、神經網路理論、馬爾科夫過程理論、馬爾科夫決策過程理論、計算機仿真技術等方法、廣義的Itô公式、Gronwall不等式、Doob鞅不等式、Borel-Cantelli引理、Kormogrov-Centson定律、大數定律、...
《統計物理模型在金融領域中的套用》是依託北京交通大學,由王軍擔任項目負責人的面上項目。項目摘要 本研究是利用機率論、統計物理模型(如:Ising模型、cantact模型、滲流等,也稱為無窮質點馬氏過程和滲流理論)來研究金融領域中的現象和規律。通過數學建模、理論分析、理論推導、數值計算等定量分析,以及把所研究的...
本書用新的理論視角和研究方法研究*庫存最佳化問題,在理論上是一種嘗試,拓展了現有的庫存理論和研究方法,具有重要的學術價值和實踐意義。作者簡介 陳杰,海南熱帶海洋學院副教授,博士。主要研究領域我套用*過程、供應鏈管理等;陳志祥,中山大學管理學院教授、博士生導師。主要研究領域為生產系統決策與最佳化、先進制...
《動態格序決策理論與方法研究》是依託四川大學,由郭春香擔任項目負責人的面上項目。項目摘要 在靜態格序決策理論與套用前期研究成果的基礎上,針對動態不確定環境的特點,運用格論、動態規劃、馬氏決策、隨機過程和圖論等工具,研究動態格序決策的決策機理、相關理論和實施方法,構建融合傳統決策理論在內的統一格序決策...
馬爾可夫決策過程的理論與套用 馬爾可夫決策過程(Markov Decision Processes簡記為MDP),是研究馬爾可夫型隨機序貫決策問題的一門學科,它既是隨機運籌學的一門分支,也是套用機率的一門分支,同時,作為馬爾可夫型系統最優控制的理論,它亦屬於隨機系統最優控制領域,MDP與近年來興起的計算機集成製造系統中的系統理論與離散...
馬爾可夫鏈具有豐富的數學理論,與其他數學學科相互滲透;而它又與自然科學、技術科學、管理科學、經濟科學以至人文科學有廣泛的交叉套用。很多問題都可建立馬爾可夫過程機率模型,運用機率論及隨機過程的理論及方法進行研究,而它們又不斷地衍生出新的研究課題。這種互動作用促進了當代機率論的飛速發展。而當前馬爾可夫鏈...
郭先平教授從事馬爾可夫決策過程(Markov Decision Processes, 簡記為 MDPs)和隨機動態對策的理論和套用研究。其專著《馬爾可夫決策過程》(與侯振挺教授合作)“填補了中國在此領域的空白”(見1999年《科學通報》中的書評),並與香港科技大學X.-R. Cao教授,墨西哥CINVESTAV-IPN O. Hernandez-Lerma教授, 澳大利亞South...
1990-至今 主編 《數學理論與套用》(《湖南數學年刊》)1988-至今 理事長 湖南省數學會 1979-1985 編委 Zeitschrift fur Wahrscheinlichkeits-theorie 教育背景 1955-1960 唐山鐵道學院(現西南交通大學)數力系大學畢業 科研獎勵 2002 綜合性科技獎勵 第三屆湖南光召科技獎 2001 馬爾可夫骨架過程--混雜系統模型 湖南省...
第1篇 潛意識基礎理論 第1章 達爾文過程與潛意識的形成 第2章 潛意識的特徵 第3章 潛意識的層次結構 3.1 潛意識的深層次結構 3.2 潛意識的淺層次結構 第4章 套用:序列效應背後 基礎原理 4.1 序列效應現象簡述 4.2 M論文主要內容概述 4.3 序列效應背後機理 4.3.1 潛意識和意識;模型的作用...
4,侯振挺,王世強,閻國軍.關於公理集合論的一個註記(Ⅰ)[J].數學理論與套用,2011,31(03):1-3.5,侯振挺.前言[J].數學理論與套用,2011,31(01):1.6,侯振挺,孔祥星,史定華,陳關榮.BA模型的數學基礎[J].數學物理學報,2010,30(05):1313-1321.7,侯振挺,張玄.馬爾可夫骨架PERT網路的最長路徑[J].數學...