強化學習遷移技術及其在互動式遊戲中的套用研究

強化學習遷移技術及其在互動式遊戲中的套用研究

《強化學習遷移技術及其在互動式遊戲中的套用研究》是依託南京大學,由高陽擔任項目負責人的面上項目。

基本介紹

  • 中文名:強化學習遷移技術及其在互動式遊戲中的套用研究
  • 項目類別:面上項目
  • 項目負責人:高陽
  • 依託單位:南京大學
項目摘要,結題摘要,

項目摘要

在強化學習遷移技術中,研究出針對單源、多源、跨域、多Agent強化學習遷移的若干模型和相關算法。採用多示例學習、分層強化學習、強化學習函式估計、關係強化學習等具體研究手段,實現以上強化學習遷移算法。並利用算法信息理論對部分的遷移方法進行理論證明。將以上方法套用到互動式遊戲領域中,實現遊戲在規模變化、任務變化和角色變換時的強化學習遷移。.基於所研究成果,將在國際學術刊物、國際一流學術會議和國內一級刊物上發表論文15-20篇;申請專利3-4項;並使本課題在強化學習遷移技術方面的研究在國際上處於領先水平。

結題摘要

本課題針對現有的強化學習遷移技術存在的問題,重關注強化學習遷移技術模型、算法及套用。在本課題中,我們從強化學習遷移目標、強化學習遷移方法、強化學習遷移套用三個角度加以研究,並研究評價準則的適用性和相關遷移方法的理論證明。具體地,本課題在學習任務相似性度量、多智慧型體強化學習遷移方法、平均獎賞強化學習中遷移方法、基於核函式估計的強化學習等方面進行了深入的研究工作,這其中包括:(1)基於bisimulation狀態距離的任務相似度度量方法及其遷移學習方法;(2)基於常數獎賞偏移值的學習算法;(3)基於核函式估計的線上選擇性時間差分學習方法;(4)多智慧型體強化學習中的均衡遷移方法;(5)稀疏互動的多智慧型體系統中任務間相似度度量方法及其知識遷移方法;(6)本課題所提出的理論方法在俄羅斯方塊、吃豆子等遊戲中的套用。基於以上的研究工作,本課題共發表學術論文32篇,其中CCF-A類論文3篇,CCF-B類論文7篇,CCF-C類論文3篇,國核心心期刊論文9篇。

相關詞條

熱門詞條

聯絡我們