智慧型體在部分可觀測馬爾可夫環境下的激勵學習研究

智慧型體在部分可觀測馬爾可夫環境下的激勵學習研究

《智慧型體在部分可觀測馬爾可夫環境下的激勵學習研究》是依託長沙理工大學,由陳煥文擔任項目負責人的面上項目。

基本介紹

  • 中文名:智慧型體在部分可觀測馬爾可夫環境下的激勵學習研究
  • 項目類別:面上項目
  • 項目負責人:陳煥文
  • 依託單位:長沙理工大學
  • 批准號:60075019
  • 申請代碼:F0603
  • 負責人職稱:教授
  • 研究期限:2001-01-01 至 2003-12-31
  • 支持經費:10(萬元)
項目摘要
智慧型體在部分可觀測馬爾可夫環境下的學習問題是當今國際機器學習領域的一個難點與焦點問題,因此具有重要的理論價值。本課題主要研究:SARSA激勵學習算法;部分可觀測馬爾煞蚧肪車奶卣鰨蛔刺氬唄緣謀澩錟P停蝗死嘌暗男睦硌笛榧盎駒恚歡嘀悄芴宓南嗷プ饔糜胙暗奈侍猓約八惴ǖ氖迪趾拖喙氐氖樟殘浴⒏叢有災っ韉任侍狻

相關詞條

熱門詞條

聯絡我們