允許策略

允許策略(permissible policy)動態規劃中一種兩不同階段間可能存在的策略.

基本介紹

  • 中文名:污染轉嫁
  • 外文名:permissible policy
允許策略
公式
表示從。到n-1階段的一個允許策略,1'o.-i(二。)表示由二。出發,從。階段到n-1階段所有允許策略的集合.允許策略為最優策略的充分必要條件是:對任意的k (OCkCn-1)和二。E Xo(第。階段的狀態集),有
允許策略
公式
其中opt表示最最佳化.當。是效益函式時,opt取max;當二是損失函式時,opt取min.若允許策略P,一,是最優策略,則對任意的k(0kCn-1),它的子策略Pk,n-1對於以二k -k-(二眾1,u戶i)為起點的k到n一1子過程來說,必是最優策略.

相關詞條

熱門詞條

聯絡我們