理察·薩頓(美國計算機科學家)

理察·薩頓(美國計算機科學家)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

理察·薩頓(Richard Sutton)是美國計算機科學家,是Deepmind的研究科學家,阿爾伯塔大學計算機學教授。薩頓和他的老師安德魯·巴托(Andrew Barto)合著《強化學習導論》(Reinforcement Learning, an introduction),他的貢獻包括時序差分學習和策略梯度方法,被稱為現代強化學習之父。

基本介紹

  • 中文名:理察·薩頓
  • 外文名:Richard S.Sutton
  • 國籍美國
  • 出生地:美國俄亥俄州
  • 畢業院校:麻薩諸塞州大學阿莫斯特分校
  • 職業:計算機科學家
  • 代表作品:Reinforcement Learning: an introduction,Neural Networks for Control
生平,教育,職業生涯,部分出版物,榮譽,

生平

薩頓出生在美國俄亥俄州。

教育

1978年獲得史丹福大學心理學學士學位,1980年獲得碩士學位。1984年,在其導師安德魯·巴托(Andrew Barto)的指導下,在麻薩諸塞大學安姆斯特分校獲得計算機科學博士學位。

職業生涯

1984年,薩頓成為麻薩諸塞大學博士後研究員。
1985-1994年期間,薩頓擔任GTE實驗室的首席技術員。
1995年,薩頓回到麻薩諸塞大學擔任高級研究科學家。
1998-2002年,薩頓在AT&T香農實驗室擔任人工智慧部門的首席技術員。
2003年以來,他一直擔任阿爾伯塔大學的計算機科學教授兼iCORE主席,同時領導該校的強化學習和人工智慧實驗室。

部分出版物

  1. Reinforcement Learning: An Introduction.
  2. Neural Networks for Control.

榮譽

2003年,薩頓獲得國際神經網路學會頒發的總統獎。
2013年,獲得麻薩諸塞大學安姆斯特分校頒發的傑出成就獎。

相關詞條

熱門詞條

聯絡我們