基於互動式動態影響圖的未知對手模型學習

基於互動式動態影響圖的未知對手模型學習

《基於互動式動態影響圖的未知對手模型學習》是依託廈門大學,由曾一鋒擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於互動式動態影響圖的未知對手模型學習
  • 項目類別:面上項目
  • 項目負責人:曾一鋒
  • 依託單位:廈門大學
項目摘要,結題摘要,

項目摘要

針對多Agent序貫決策最佳化問題,主體Agent需要識別其他Agent的真實模型,達到對其他Agent行為的準確預測。但是有限的主體Agent模型空間往往不能包括其他Agent的真實模型,這導致傳統的貝葉斯公式不能被用來更新其他Agent模型的信度。本項目擬基於互動式動態影響圖研究如何通過學習模型之間的相關性最佳化主體Agent的決策。通過結合多Agent決策系統、機器學習、資訊理論等技術,本項目採用互信息量化模型之間的相關性;構造動態隱性貝葉斯網路以準確地計算互信息;建立順序學習技術以增強算法的適應性;根據相關性的實時變化動態最佳化模型空間;開發無人駕駛飛機仿真平台以驗證模型及其算法的正確性;採用類人機器人對抗演練展示研究技術的實際效用。本項目將首次把線上機器學習方法融入到互動式動態影響圖的求解過程中,從而克服傳統貝葉斯方法更新模型的局限性,為解決實際多Agent序貫決策優問題提供堅實的基礎。

結題摘要

針對多Agent序貫決策最佳化問題,主體Agent需要識別其他Agent的真實模型,達到對其他Agent行為的準確預測。但是有限的主體Agent模型空間往往不能包括其他Agent的真實模型,這導致傳統的貝葉斯公式不能被用來更新其他Agent模型的信度。本項目基於互動式動態影響圖的基本框架,從研究模型之間的相關性出發,通過機器學習的方法,降低模型空間,達到最佳化模型求解的目的。本項目的研究進一步提高了多智慧型體序貫決策的能力,並深入探討了關於識別智慧型體真實模型的問題,取得了一些主要研究成果,對多智慧型體系統的研究有一定的指導意義。主要研究成果發表智慧型體研究領域的頂級國際會議論文和重要學術期刊。

相關詞條

熱門詞條

聯絡我們