Version imprimable |
![]() |
Apprentissage par renforcement | |
Auteur(s) : PREUX PHILIPPE
26-01-2008
Éditeur(s) : Université Lille 3 ; Description : Ce cours s'organise selon le schéma suivant : Après avoir défini précisément le problème que l'on veut résoudre, c'est-à-dire le problème de contrôle optimal, on démontre des propriétés importantes liées à ce problème et à sa solution. Ce faisant, on essaie de donner de l'intuition concernant ce problème afin de comprendre à quoi sert ce que l'on essaie de faire. Disons-le tout de suite, le problème que l'on va étudier est extrêmement général, les applications en sont très variées et l'utilisation de ce qui suit est grande. Mots-clés libres : processus de décision de Markov, contrôle optimal, Programmation dynamique, méthode de Monte-Carlo, fuscia Classification générale : Informatique Mathématiques Accès à la ressource : http://www.grappa.univ-lille3.fr/~ppreux/Documents... Conditions d'utilisation : Ce document est soumis à la licence GFDL (http://www.gnu.org/copyleft/fdl.html) | DONNEES PEDAGOGIQUES Type pédagogique : cours / présentation Granularité : cours Niveau : master Public cible : apprenant Proposition d'utilisation : Ce cours est dispensé à des étudiants en Master 2 spécialité Modélisation du comportement et de la cognition Difficulté : moyen Durée d'apprentissage : 48 heures Age attendu du l'utilisateur : 18 et + DONNEES TECHNIQUES Date de publication : 13-02-2009 Format : application/pdf Exigences techniques : Nécessite Adobe Acrobat Reader ou tout autre logiciel permettant la lecture de documents au format PDF |
Exporter au format XML |