序貫決策

序貫決策

序貫決策是指按時間順序排列起來,以得到按順序的各種決策(策略),是用於隨機性或不確定性動態系統最最佳化的決策方法。

基本介紹

  • 中文名:序貫決策
  • 外文名:Sequential Decision
  • 別名:動態決策法
  • 學科:運籌學
  • 隸屬:序貫決策分析
  • 特點:無後效性、多階段性、預測性等
基本概念,特點,過程,套用,

基本概念

有些決策問題,決策者僅作一次決策即可,這類決策方法稱單階段決策。在社會主義市場經濟條件下,企業的經營活動為適應市場激烈競爭的需要,不僅需要單階段決策,更需要進行多階段決策,即序貫決策。
序貫決策是指按時間順序排列起來,以得到按順序的各種決策(策略)。也就是在時間上有先後之別的多階段決策方法,也稱動態決策法。多階段決策的每一個階段都需作出決策,從而使整個過程達到最優。多階段的選取不是任意決定的,它依賴於當前面臨的狀態,不給以後的發展產生影響,從而影響整個過程的活動。當各個階段的決策確定後,就組成了問題的決策序列或策略,稱為決策集合。

特點

  1. 無後效性。序貫決策是前一階段決策方案的選擇,直接影響到後一階段決策方案的選擇,後一階段決策方案的選擇取決於前一階段決策方案的結果。
  2. 多階段性。序貫決策具有在時間上有先後之別的多階段決策。決策者關心的是多階段決策的總結果,而不是各階段的當即結果。
  3. 預測性。決策的實施是對各採用的多種可行方案進行比較,擇其最優。序貫決策若對各種可行方案的前景加以預測,在預測的結果中會顯示出最優可行方案。
  4. 條件性。序貫決策是根據最優性原理求解,問題是所涉及的過程都要滿足一定的條件,即馬爾柯夫性。也就是利用轉移機率矩陣和相應的利潤矩陣對不同方案在作出預測的基礎上進行決策。
  5. 連續性。每個階段所面臨的狀態,帶有各自的不確定性,需要對每一個階段作出決策,下一個階段決策是在前一個階段決策基礎上再進行決策,這樣連續進行,形成一序列方案。

過程

從初始狀態開始,每個時刻作出最優決策後,接著觀察下一步實際出現的狀態,即收集新的信息,然後再作出新的最優決策,反覆進行直至最後。
系統在每次作出決策後下一步可能出現的狀態是不能確切預知的,存在兩種情況:
  1. 系統下一步可能出現的狀態的機率分布是已知的,可用客觀機率的條件分布來描述。對於這類系統的序貫決策研究得較完滿的是狀態轉移律具有無後效性的系統,相應的序貫決策稱為馬爾可夫決策過程,它是將馬爾可夫過程理論與決定性動態規劃相結合的產物。
  2. 系統下一步可能出現的狀態的機率分布不知道,只能用主觀機率的條件分布來描述。用於這類系統的序貫決策屬於決策分析的內容。

套用

有些決策問題,在進行決策後又產生一些新情況,需要進行新的決策,接著又有一些新的情況,又需要進行新的決策。這樣決策、情況、決策…,就構成一個序列,這就是序貫決策。與多階段決策中階段數確定相比,序貫決策中決策過程階段數並不明顯,也沒有明確的結束階段,其決策階段數依賴於決策過程中出現的狀況。序貫決策是馬爾可夫決策的一種,它主要研究的對象是運行系統的狀態和狀態的轉移。即根據變數的現實狀態及其發展變化趨勢,預測它在未來可能出現的狀態,以做出正確決策。
序貫決策方法廣泛套用於物流配送車輛調度、家電產品運營、應急資源配置等情況。套用序貫決策方法,可大大減少計算量。同時,對於給定的動態系統而言,初始狀態向量為已知,系統經過相當長時間運行後,所選擇的一序列方案,是每一階段的平均收益最大的方案,因此,序貫決策方法是一種簡單而又實用的決策方法。

相關詞條

熱門詞條

聯絡我們