動態規劃策略

動態規劃策略（policy of dynamic programming）是指在多階段決策過程中的每一階段所作出的決策。它是一個依賴於狀態的函式。策略是一些決策函式組成的向量函式，它的某個分量就是某個階段的決策函式。從某個階段開始直到最後階段的過程稱為子過程，而相應的策略稱為子策略。如果某個策略使系統的總收益為極大或極小，則此策略為最優策略。在一般的多階段決策問題中，決策是獨立變數，動態規劃方法的目的是要求出最優策略，因而最優策略也稱為最優解。

動態規劃策略

相關詞條

熱門詞條