《連續時間馬氏決策過程受約束問題的研究》是依託華僑大學,由魏清達擔任項目負責人的數學天元基金項目。
基本介紹
- 中文名:連續時間馬氏決策過程受約束問題的研究
- 項目類別:數學天元基金項目
- 項目負責人:魏清達
- 依託單位:華僑大學
《連續時間馬氏決策過程受約束問題的研究》是依託華僑大學,由魏清達擔任項目負責人的數學天元基金項目。
《連續時間馬氏決策過程受約束問題的研究》是依託華僑大學,由魏清達擔任項目負責人的數學天元基金項目。項目摘要馬氏決策過程在眾多領域有著廣泛的套用,如金融保險、通信網路、庫存管理、可靠性理論等。現實世界中的許多套用問題涉及到...
1.:一般狀態的連續時間馬氏決策過程的最優性條件和算法2:受約束連續時間馬氏決策過程及其參數的攝動理論;3:最優解的特徵和實際模型的套用問題。本項目中的研究內容是馬氏決策過程中的前沿和核心問題。因而本項目的研究對推動馬氏決策...
馬氏決策過程已在金融保險、風險管理、通信網路、庫存管理、排隊系統等眾多領域有廣泛的套用。本項目將期望效用函式理論和累積前景理論套用到連續時間馬氏決策過程,從風險和決策者的行為這兩個視角研究以下問題:(1) 利用效用函式刻畫決策者...
MDP的歷史可以追溯至20世紀50年代動力系統研究中的最優控制(optimal control)問題,1957年,美國學者Richard Bellman通過離散隨機最優控制模型首次提出了離散時間馬爾可夫決策過程。1960年和1962年,美國學者Ronald A. Howard和David Blackwell...
《半馬氏隨機動態系統的多約束和方差最小問題》是依託中山大學,由黃永輝擔任項目負責人的青年科學基金項目。中文摘要 半馬氏隨機動態系統是一類逗留時間允許服從任意機率分布的動態系統,其決策時刻可以為任意隨機時刻,適合描述和分析許多實際...
研究了應急任務持續時間、資源消耗不確定,以及時間、資源約束下應急處置任務網路規劃與調度問題:將MDP模型與約束滿足方法結合,同時考慮決策者的風險態度,提出了一種基於風險可接受度的應急任務網路規劃模型。利用約束滿足算法,剔除時間、資...
理論研究為探索離散時間馬氏決策過程風險機率準則意義下最優策略存在的更一般的條件及其算法。套用研究主要包括:(1)研究機率布爾網路中每個布爾網路被選取的機率;(2)利用離散時間馬氏決策過程建模,對機率布爾網路中的最優干預問題展開研究...
經典 bandit process 研究主要分為三類:連續時間、離散時間以及半馬氏類 過程(或者跳過程)上的 bandit process 最優決策問題,該框架對加工機器在各 個臂(arms)之間的切換不加任何約束。但是在實際問題中,往往會碰到加工機器 不能在各個...