新型強化學習算法及套用研究

新型強化學習算法及套用研究

《新型強化學習算法及套用研究》是依託南京大學,由高陽擔任項目負責人的面上項目。

基本介紹

  • 中文名:新型強化學習算法及套用研究
  • 項目類別:面上項目
  • 項目負責人:高陽
  • 依託單位:南京大學
  • 批准號:60775046
  • 申請代碼:F0603
  • 負責人職稱:教授
  • 研究期限:2008-01-01 至 2010-12-31
  • 支持經費:27(萬元)
項目摘要
在強化學習問題中,研究出能夠解決大規模強化學習問題的若干新型強化學習模型和相關算法。研究一種新的關係強化學習模型和算法;將關係強化學習模型套用到Action Model中,研究基於關係強化學習的Action Model學習算法;結合關係強化學習和 傳遞學習技術,設計滿足傳遞學習任務要求的關係強化學習算法;研究基於核的強化學習算法,設計強化學習核函式選取策略,設計有效的Exploration算法。將以上研究的關係強化學習、基於核的強化學習、Action Model和傳遞學習套用到智慧型NPC遊戲平台中,研究一個基於機器學習技術的面向第1人稱射擊類遊戲的智慧型NPC遊戲平台。

相關詞條

熱門詞條

聯絡我們