L’apprentissage par renforcement (Reinforcement Learning en anglais ) est un domaine de l’apprentissage automatique qui concerne la manière dont les agents logiciels doivent prendre des mesures dans un environnement afin de maximiser une notion de récompense cumulative.

« Retour à la page accueil du lexique