《馬爾可夫決策過程理論與套用》是2015年科學出版社出版的圖書,作者是劉克、曹平。
基本介紹
- 中文名:馬爾可夫決策過程理論與套用
- 作者:劉克,曹平
- ISBN:978-7-03-043123-3
- 頁數:292
- 定價:98.00
- 出版社:科學出版社
- 出版時間:2015-03
- 裝幀:平裝
- 開本:B5
《馬爾可夫決策過程理論與套用》是2015年科學出版社出版的圖書,作者是劉克、曹平。
《馬爾可夫決策過程理論與套用》是2015年科學出版社出版的圖書,作者是劉克、曹平。內容簡介馬爾可夫決策過程理論與套用馬氏決策過程是研究多階段決策問題的一種方法,其基本思想是著重於決策過程的形象化描述,包括有:決策時刻、系...
MDP的理論基礎是馬爾可夫鏈,因此也被視為考慮了動作的馬爾可夫模型。在離散時間上建立的MDP被稱為“離散時間馬爾可夫決策過程(descrete-time MDP)”,反之則被稱為“連續時間馬爾可夫決策過程(continuous-time MDP)”。此外MDP存在一些...
馬爾可夫是彼得堡數學學派的代表人物。以數論和機率論方面的工作著稱。他的主要著作有《機率演算》等。在數論方面,他研究了連分數和二次不定式理論 ,解決了許多難題 。在機率論中,他發展了矩法,擴大了大數律和中心極限定理的套用範圍...
馬爾可夫決策法是指用馬爾可夫轉移矩陣進行決策的方法,屬於機率型決策技術。馬爾可夫決策法的基本原理是:決策者在近期內不能確知某一自然狀態出現的機率,但知道各自然狀態之間機率分布變化即轉移矩陣時,可以根據轉移矩陣求出未來環境各自然...
馬爾可夫是彼得堡數學學派的代表人物。以數論和機率論方面的工作著稱。他的主要著作有《機率演算》等。在數論方面,他研究了連分數和二次不定式理論 ,解決了許多難題 。在機率論中,他發展了矩法,擴大了大數律和中心極限定理的套用範圍...
本書講述了馬爾可夫鏈模型在排隊系統、網頁重要性排名、製造系統、再製造系統、庫存系統以及金融風險管理等方面的最新套用進展.全書共安排8章內容,第1章介紹馬爾可夫鏈、隱馬爾可夫模型和馬爾可夫決策過程的基本理論和方法,其餘7章分別介紹...
馬爾可夫分析法已成為市場預測的有效工具,用來預測顧客的購買行為和商品的市場占有率等,同時也套用在企業的人力資源管理上。基本涵義 單個生產廠家的產品在同類商品總額中所占的比率,稱為該廠產品的市場占有率。在激烈的競爭中,市場占有...
部分可觀察馬爾可夫決策過程(Partially Observable Markov Decision Process,縮寫:POMDP),是一種通用化的馬爾可夫決策過程。POMDP模擬智慧型體決策程式是假設系統動態由MDP決定,但是智慧型體無法直接觀察狀態。相反的,它必須要根據模型的全域與...
本項目提出的決策-控制策略相較於傳統的控制策略具有更大的靈活性,在確保系統穩定的同時有效降低了系統代價,對於豐富和發展馬爾可夫跳躍系統的控制具有理論意義,而且對其在工程領域中的推廣也具有實際套用價值。結題摘要 馬爾可夫跳躍系統由...
因此,運算元族{Tₜ}構成運算元半群,這就是馬爾可夫(轉移)半群。由於這個半群總可完全惟一地決定過程的轉移函式,考慮馬爾可夫過程相應的運算元半群是很有好處的。由此而發展了一整套馬爾可夫半群理論。人們還可以考慮另一個半群:設M(E)...
馬爾可夫決策規劃 馬爾可夫決策規劃(Markov decision programming)是1993年公布的數學名詞。公布時間 1993年,經全國科學技術名詞審定委員會審定發布。出處 《數學名詞》第一版。
人們都可以看到一種叫作隨機過程的數學模型:從銀河亮度的起伏到星系空間的物質分布、從分子的布朗運動到原子的蛻變過程,從化學反應動力學到電話通訊理論、從謠言的傳播到傳染病的流行、從市場預測到密碼破譯,隨機過程理論及其套用幾乎無...
10.5 套用 184 10.5.1 肺癌的決策支持系統 184 10.5.2 決策理論看護人 187 10.6 補充閱讀 189 10.7 練習 190 第11章 馬爾可夫決策過程 191 11.1 引言 191 11.2 建模 191 11.3 評估 194 11.3.1 值...
馬爾可夫決策過程的理論與套用 馬爾可夫決策過程(Markov Decision Processes簡記為MDP),是研究馬爾可夫型隨機序貫決策問題的一門學科,它既是隨機運籌學的一門分支,也是套用機率的一門分支,同時,作為馬爾可夫型系統最優控制的理論,它亦...
馬爾可夫過程,是俄國數學家馬爾可夫1907年提出的一種數學模型。它概括了自然界一系列隨機現象,既屬於數學基礎理論範疇,又在自然科學、技術科學和社會科學中有廣泛的套用價值。馬爾可夫過程成為機率論中十分重要的理論分支。他經過10多年的潛心...
郭先平教授從事馬爾可夫決策過程(Markov Decision Processes, 簡記為 MDPs)和隨機動態對策的理論和套用研究。其專著《馬爾可夫決策過程》(與侯振挺教授合作)“填補了中國在此領域的空白”(見1999年《科學通報》中的書評),並與香港科技...
11.3 風險型決策 11.3.1 期望值準則 11.3.2 決策樹法 11.3.3 貝葉斯決策 11.4 效用理論 11.4.1 效用的概念 11.4.2 效用曲線的繪製 11.4.3 效用曲線的類型 11.4.4 效用曲線的套用 11.5 馬爾可夫決策 11.5.1 ...