Apprentissage par renforcement

Auteur(s) : PREUX PHILIPPE 26-01-2008
Éditeur(s) : Université Lille 3 ;

Description : Ce cours s'organise selon le schéma suivant : Après avoir défini précisément le problème que l'on veut résoudre, c'est-à-dire le problème de contrôle optimal, on démontre des propriétés importantes liées à ce problème et à sa solution. Ce faisant, on essaie de donner de l'intuition concernant ce problème afin de comprendre à quoi sert ce que l'on essaie de faire. Disons-le tout de suite, le problème que l'on va étudier est extrêmement général, les applications en sont très variées et l'utilisation de ce qui suit est grande.

Mots-clés libres : processus de décision de Markov, contrôle optimal, Programmation dynamique, méthode de Monte-Carlo, fuscia
Classification générale : Informatique
Mathématiques

Accès à la ressource : http://www.grappa.univ-lille3.fr/~ppreux/Documents...
Conditions d'utilisation : Ce document est soumis à la licence GFDL (http://www.gnu.org/copyleft/fdl.html)

DONNEES PEDAGOGIQUES

Type pédagogique : cours / présentation
Granularité : cours
Niveau : master
Public cible : apprenant

Proposition d'utilisation : Ce cours est dispensé à des étudiants en Master 2 spécialité Modélisation du comportement et de la cognition

Difficulté : moyen

Durée d'apprentissage : 48 heures

Age attendu du l'utilisateur : 18 et +

DONNEES TECHNIQUES

Date de publication : 13-02-2009

Format : application/pdf

Exigences techniques : Nécessite Adobe Acrobat Reader ou tout autre logiciel permettant la lecture de documents au format PDF

Exporter au format XML