基本介紹
- 中文名:受約束的連續時間馬爾可夫決策過程
- 論文作者:張蘭蘭
- 導師:郭先平
- 學科專業:機率論與數理統計
副題名
外文題名
論文作者
張蘭蘭著
導師
郭先平指導
學科專業
機率論與數理統計
學位級別
博士論文
學位授予單位
中山大學
學位授予時間
2008
關鍵字
馬爾可夫過程 隨機過程 決策
館藏號
C934
館藏目錄
2010\C934\1
1. 受約束的連續時間馬爾可夫決策過程 .中國圖書館[引用日期2014-08-16] V百科往期回顧 詞條統計 瀏覽次數:次 編輯次數:3次歷史版本 最近更新: 創建者:crtmfor...
在離散時間上建立的MDP被稱為“離散時間馬爾可夫決策過程(descrete-time MDP)”,反之則被稱為“連續時間馬爾可夫決策過程(continuous-time MDP)” [1] 。此外MDP...
馬爾可夫決策過程引論是基於馬爾可夫過程理論的隨機動態系統的最優決策過程。馬爾可夫決策過程是序貫決策的主要研究領域。它是馬爾可夫過程與確定性的動態規劃相結合的產物...
適用於連續指數集的馬爾可夫鏈被稱為馬爾可夫過程(Markov process),但有時也被視為馬爾可夫鏈的子集,即連續時間馬爾可夫鏈(Continuous-Time MC, CTMC),與離散...
第1章簡介離散和連續時間馬爾可夫鏈的經典理論,突出了有限狀態的馬爾可夫鏈與...5.4.3有限視野硬約束5.5高階馬爾可夫決策過程5.5.1平穩策略5.5.2在客戶終身...
4.8 時間可逆的馬爾可夫鏈 1984.9 馬爾可夫鏈蒙特卡羅方法 2064.10 馬爾可夫決策過程 2094.11 隱馬爾可夫鏈 212習題218參考文獻 230第5章 指數分布與泊松過程 231...
11.1.2馬爾可夫決策過程11.1.3連續時間馬爾可夫鏈11.2機率時序邏輯11.2.1機率計算樹邏輯11.2.2連續隨機邏輯11.3機率模型檢測工具及套用...
首先,介紹離散時間馬爾可夫鏈、馬爾可夫決策過程、連續時間馬爾可夫鏈和機率實時解釋系統中的限界檢測技術.然後,討論模型檢測機率、實時認知時態邏輯中的二值與三值...