基於多Agent的通信互動式動態影響圖研究及套用

項目摘要

多Agent的通信行為是目前國際上研究多Agent決策問題中具有挑戰性的新課題，其圖形表述和模型求解尤為引人矚目。目前的互動式動態影響圖（I-DIDs）忽略了Agent的通信能力，主要通過對其他Agent模型的猜測和識別來推斷其可能的決策，這存在著主觀性和不確定性，導致模型效用降低、求解困難、套用受限。本項目在前期工作的基礎上，將Agent的通信行為引入I-DIDs，套用機率圖模型理論、部分可觀測馬爾可夫決策過程性質和最大獎勵期望值原理，建模通信互動式動態影響圖（Com-I-DIDs）；根據值等價和行為等價原理重構其他Agent模型節點的條件機率模型，提出新的模型求解方法，降低計算難度，確保模型解的最優性；根據Cooper價值節點轉化法，通過對其他Agent行為的靈敏度分析探索多Agent相互建模嵌套層數；開發Com-I-DIDs決策軟體，以自動小車存取系統為例進行套用研究。

結題摘要

.針對以往互動式動態影響圖（I-DIDs）忽略了Agent的通信能力，從而導致模型效用降低、求解困難、套用受限等問題。本項目在前期工作的基礎上，將Agent的通信行為引入到I-DIDs，套用機率圖模型理論、部分可觀測馬爾可夫決策過程性質和最大獎勵期望值原理，建立基於I-DID的通信互動式動態影響圖(Com-I-DID)模型。為解決通信互動式動態影響圖和互動式動態影響圖的候選模型空間太大問題，發明了兩種減少模型空間的算法：第一種算法聚集了行為等價類並選擇性的更新模型，只更新那些在下一個時間片有不同預測行為的模型；第二種算法進一步壓縮了模型空間，將每一個時間片動作相同的模型進行聚類。為進一步簡化計算，提出了一種用雙壓縮方法的近似求解算法。本項目以自動小車存取系統為例進行了通信互動式動態影響圖(Com-I-DID)模型的套用仿真實驗。此外，本項目研究中，進一步探討了互動式動態影響圖I-DID和通信互動式動態影響圖(Com-I-DID)在原理、模型和算法方面的若干共性，並提出一系列更具有普遍性的方法。這些方法具有在空間和時間上同時對模型進行聚類的能力，採用面向對象設計的概念來最佳化自我擴展和自我壓縮；提出一種基於部分決策樹的模型求解算法，並改進了利用部分策略樹來判斷行為等價的方法，發展了一種叫做增長式比較的策略；提出基於分段行為等價的模型改進算法；提出基於信度-行為的互動式動態影響圖的近似算法。

基於多Agent的通信互動式動態影響圖研究及套用

基本介紹

項目摘要

結題摘要

相關詞條

熱門詞條