動態規劃策略

動態規劃策略(policy of dynamic programming)是指在多階段決策過程中的每一階段所作出的決策。它是一個依賴於狀態的函式。策略是一些決策函式組成的向量函式,它的某個分量就是某個階段的決策函式。從某個階段開始直到最後階段的過程稱為子過程,而相應的策略稱為子策略。如果某個策略使系統的總收益為極大或極小,則此策略為最優策略。在一般的多階段決策問題中,決策是獨立變數,動態規劃方法的目的是要求出最優策略,因而最優策略也稱為最優解。

相關詞條

熱門詞條

聯絡我們