量子強化學習理論、算法及套用

量子強化學習理論、算法及套用

《量子強化學習理論、算法及套用》是依託浙江大學,由董道毅擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:量子強化學習理論、算法及套用
  • 依託單位:浙江大學
  • 項目負責人:董道毅
  • 項目類別:青年科學基金項目
  • 申請代碼:F0201
  • 批准號:60703083
  • 負責人職稱:副教授
  • 研究期限:2008-01-01 至 2010-12-31
  • 支持經費:20(萬元)
項目摘要
設計快速高效的學習算法是人工智慧中的一個關鍵問題,強化學習是機器學習領域的一種重要學習方法。項目以自主移動機器人學習和量子系統控制設計為套用背景,擬將量子理論系統的引入到強化學習系統的分析與設計中,探索新的知識表示方法和學習機理,提出一套完整的量子強化學習方法。內容主要包括:①將傳統強化學習中的狀態/動作進行量子化表示,建立量子強化學習的正式知識表示,給出量子強化學習的動作選擇策略和值函式更新規則,建立量子強化學習的完整算法框架;②分析量子強化學習算法的收斂性、搜尋策略等問題,從理論上找出高效快速的學習模式;③通過經典計算機仿真實現不同策略下的量子強化學習算法,以驗證量子強化學習的優越性,通過對其物理實現進行分析以論證方法的可行性,根據分析結果建議合適的物理實現方案;④結合自主移動機器人學習和量子系統控制問題考慮用量子強化學習算法解決實際問題,並對量子人工智慧和量子學習控制進行探索。

相關詞條

熱門詞條

聯絡我們