多目標序貫決策問題

介紹
多目標序貫決策問題(decision problem of multiobjective sequential)一類決策問題.是有多 個目標函式的序貫決策問題.多目標序貫決策問題 可分為以下幾類: 1.序貫決策過程為一確定的、有限周期的過程. 不考慮相鄰兩周期狀態的轉移,而代之以狀態集的 簡單劃分,即把狀態的一非空任意集及劃分為一 有序的集合(XmX2,...}Xn)}XmXz,...,X。是非空 的不相交的子集,X,表示過程在第t個周期的可能 狀態的集.此外,不採用實值的效用函式,而代之以 策略的優先關係,策略的優先關係為全預序(即弱 序).這種分析方法稱為優序動態規劃. 2.序貫決策的過程是確定的、有限周期的,狀態 從一周期按給定的規則轉移到下一周期.多目標的 損失函式為一向量函式.策略的優先關係是偏預序. 尋求此序貫決策問題的帕雷托有效解(參見“帕雷托 解”). 3.序貫決策過程是確定的、無限周期的,狀態從 一周期按給定的規則轉移到下一周期,不採用實值 的效用函式,而代之以策略的優先關係.策略的優先 關係為全預序.這種分析方法稱為順序動態規劃.此 法可推廣到隨機過程. 4.序貫決策過程為無限周期的馬爾可夫決策過 程,狀態從一周期按給定的轉移機率轉移到下一周 期.多目標的報酬函式為一折扣的向量函式.策略的 優先關係為偏預序.尋求此序貫決策問題的帕雷托 有效解. 以上四類問題按其策略的優先關係可區分為全 預序和偏序.若是全預序,定義一序數效用函式,尋 求最佳調和解.但優先關係為偏預序時,則藉助凸錐 尋找有效解(參見“錐有效解”).這四類問題又可劃 分為有限周期的和無限周期的.求解多目標序貫決 策問題的常用方法為優序動態規劃方法和順序動態 規劃方法.

相關詞條

熱門詞條

聯絡我們