主從對策是一種多級遞階決策問題,由經濟學家斯塔克伯格(Von Stackelberg)提出。
定義,實例,
定義
主從對策(leader-follower game)亦稱斯塔克伯格對策,設1.為上級(主方),其決策變數為xi.,信息為zc,策略為二:- YG czrJ,而目標函式為Kc (xi.,x,r).而下級F.(從方) 的相應變數亦類似地可表示為二F' , z,.,二;=Y,: (zh ) 和KF (x1,二:).主從對策問題就是主方應如何選擇並宣布他的策略YI.,使下級在此前提下為最佳化自己的K:而執行的Y;最符合主方的利益.在較簡單情形下,若上級直接宣布x:的值,而下級可根據z,: _ xi.來選擇
實例
這就是從方的理性回響.由於主方可以預見到這一結果,問題將歸結為選擇x,,,使K}, = K}.(二:, YF(x,))達到最大.由此可見,主從對策實際上是對從方行為的間接控制問題. 這種提法可以推廣到多階段的動態的情形.設主從雙方共同控制一個動態系統毖一f(二,uc, u,:, t>, tE Co,T],這時u:和u:均為時間函式,相應的目標函式則為
這時問題仍然是主方如何選擇最優的u%,使從方以此代人自己的問題後求解K;為最大所得的u,:.值恰好能使主方得到最好的K,,.由於這裡涉及一種帶有未知函式u:的最優控制問題族對u:的求解問題,理論上有很大難度,其結果甚至還與主方擁有怎樣的動態信息有關,即u*是開環式的時間函式m.(t), 狀態反饋式的u, (x),還是帶記憶的反饋
這都會帶來不同的後果.當主方直接根據z:一腳來進行決策,亦即制訂“政策”m. =Yi. W戶來控制從方的行為時,即是所謂激勵控制問題(參見“激勵控制”). 主從控制的思想可用於多級管理結構中為上級制定恰當的策略來對下級的行為進行間接的、巨觀的調控,有重要的實際意義.