Aller au contenu

Richard Sutton

Un article de Wikipédia, l'encyclopédie libre.
Richard S. Sutton
Richard Sutton, le 27 octobre 2016
Biographie
Naissance
Entre et Voir et modifier les données sur Wikidata
OhioVoir et modifier les données sur Wikidata
Nationalité
Domicile
Formation
Activités
Autres informations
A travaillé pour
Membre de
Directeur de thèse
Site web
Distinction
AAAI Fellow (2001)
President's Award (INNS) (2003)

Richard Sutton est un informaticien canadien, professeur d'informatique à l'université de l'Alberta. Il est reconnu comme l'un des fondateurs de l'apprentissage par renforcement, domaine auquel il a apporté plusieurs contributions majeures telles que le temporal difference learning et les méthodes de gradient[1].

Sutton reçoit son B.A. en psychologie à l'université Stanford en 1978, et ses M.Sc. et Ph.D en informatique à l'université du Massachusetts à Amherst en 1980 et 1984, sous la direction d'Andrew Barto. Sa thèse, « Temporal Credit Assignment in Reinforcement Learning », introduisait en particulier des idées de temporal difference learning.

Distinctions

[modifier | modifier le code]

Il est lauréat du prix Turing 2024[2].

Publications

[modifier | modifier le code]

Références

[modifier | modifier le code]
  1. (en-US) Gregory Piatetsky, « Exclusive: Interview with Rich Sutton, the Father of Reinforcement Learning », sur KDnuggets (consulté le )
  2. Yannick Chavanne, « Le prix Turing récompense deux pionniers de l’IA », sur ictjournal.ch, (consulté le )

Liens externes

[modifier | modifier le code]