《智慧型體在部分可觀測馬爾可夫環境下的激勵學習研究》是依託長沙理工大學,由陳煥文擔任項目負責人的面上項目。
基本介紹
- 中文名:智慧型體在部分可觀測馬爾可夫環境下的激勵學習研究
- 項目類別:面上項目
- 項目負責人:陳煥文
- 依託單位:長沙理工大學
- 批准號:60075019
- 申請代碼:F0603
- 負責人職稱:教授
- 研究期限:2001-01-01 至 2003-12-31
- 支持經費:10(萬元)
項目摘要
智慧型體在部分可觀測馬爾可夫環境下的學習問題是當今國際機器學習領域的一個難點與焦點問題,因此具有重要的理論價值。本課題主要研究:SARSA激勵學習算法;部分可觀測馬爾煞蚧肪車奶卣鰨蛔刺氬唄緣謀澩錟P停蝗死嘌暗男睦硌笛榧盎駒恚歡嘀悄芴宓南嗷プ饔糜胙暗奈侍猓約八惴ǖ氖迪趾拖喙氐氖樟殘浴⒏叢有災っ韉任侍狻