多目標序貫決策問題

多目標序貫決策問題(decision problem of multiobjective sequential),一類決策問題,是有多 個目標函式的序貫決策問題。

基本介紹

  • 中文名:多目標序貫決策問題
  • 外文名:decision problem of multiobjective sequential
介紹
多目標序貫決策問題 可分為以下幾類: 1.序貫決策過程為一確定的、有限周期的過程. 不考慮相鄰兩周期狀態的轉移,而代之以狀態集的 簡單劃分,即把狀態的一非空任意集及劃分為一 有序的集合(XmX2,...Xn)XmXz,...,X。是非空 的不相交的子集,X,表示過程在第t個周期的可能 狀態的集.此外,不採用實值的效用函式,而代之以 策略的優先關係,策略的優先關係為全預序(即弱 序).這種分析方法稱為優序動態規劃. 2.序貫決策的過程是確定的、有限周期的,狀態 從一周期按給定的規則轉移到下一周期.多目標的 損失函式為一向量函式.策略的優先關係是偏預序. 尋求此序貫決策問題的帕雷托有效解(參見“帕雷托 解”). 3.序貫決策過程是確定的、無限周期的,狀態從 一周期按給定的規則轉移到下一周期,不採用實值 的效用函式,而代之以策略的優先關係.策略的優先 關係為全預序.這種分析方法稱為順序動態規劃.此 法可推廣到隨機過程. 4.序貫決策過程為無限周期的馬爾可夫決策過 程,狀態從一周期按給定的轉移機率轉移到下一周 期.多目標的報酬函式為一折扣的向量函式.策略的 優先關係為偏預序.尋求此序貫決策問題的帕雷托 有效解. 以上四類問題按其策略的優先關係可區分為全 預序和偏序.若是全預序,定義一序數效用函式,尋 求最佳調和解.但優先關係為偏預序時,則藉助凸錐 尋找有效解(參見“錐有效解”).這四類問題又可劃 分為有限周期的和無限周期的.求解多目標序貫決 策問題的常用方法為優序動態規劃方法和順序動態 規劃方法.

相關詞條

熱門詞條

聯絡我們