動態規劃(dynamic programming)是運籌學的一個分支,是求解決策過程(decision process)最最佳化的數學方法。20世紀50年代初美國數學家R.E.Bellman等人在研究多階段決策...
動態規劃狀態(state of dynamic programming)是指在多階段決策過程中,為建立模型及便於計算,引入每個階段的狀態變數。它和問題的約束條件緊密關聯。動態規劃引入適當的...
自適應動態規劃(Adaptive/Approximate Dynamic Programming,ADP),又叫近似動態規劃,是人工智慧和控制領域發展而交匯形成的新興學科。ADP方法主要包括三種基本類型:啟發式...
狀態轉移方程,是動態規劃中本階段的狀態往往是上一階段狀態和上一階段決策的結果。如果給定了第K階段的狀態Sk以及決策uk(Sk),則第K+1階段的狀態Sk+1也就完全...
用動態規劃方法解決決策過程的最最佳化問題所需建立的模型。一般動態規劃模型包括以下幾個組成部分:(1)時間參量集。由於實際的決策過程是隨時間而變化的,所以時間參量...
動態規劃策略(policy of dynamic programming)是指在多階段決策過程中的每一階段所作出的決策。它是一個依賴於狀態的函式。策略是一些決策函式組成的向量函式,它的...
樹形動態規劃問題可以分解成若干相互聯繫的階段,在每一個階段都要做出決策,全部過程的決策是一個決策序列。要使整個活動的總體效果達到最優的問題,稱為多階段決策...
動態規劃嵌入原理是指把研究動態決策過程的單一的最最佳化問題嵌入到具有結構與特徵不變的一族最最佳化問題中去的原理。它是動態規劃的兩個基本原理之一(另一個是最優...
動態規劃模型在越來越多的套用在水資源規劃中,能夠將高維問題化為相對簡單的低維問題,擁有對目標函式和約束條件的函式形式限制較寬、處理比較方便等優點。以經濟、...
無後效性是指如果在某個階段上過程的狀態已知,則從此階段以後過程的發展變化僅與此階段的狀態有關,而與過程在此階段以前的階段所經歷過的狀態無關。利用動態規劃...
貝爾曼方程(Bellman Equation)也被稱作動態規劃方程(Dynamic Programming Equation),由理查·貝爾曼(Richard Bellman)發現。貝爾曼方程是動態規劃(Dynamic Programming)這些...
策略疊代法(policy iteration method)是動態規劃中求最優策略的基本方法之一。它藉助於動態規劃基本方程,交替使用“求值計算”和“策略改進”兩個步驟,求出逐次改進...