L’apprentissage d’un comportement pour effectuer une tâche donnée peut être réalisé en interagissant avec l’environnement. C’est l’essence même de l’apprentissage par renforcement (RL), où un agent (automatisé) apprend à résoudre un problème par un processus itératif d’essais et d’erreurs. Par conséquent, ces méthodes nécessitent généralement de pouvoir intervenir sur l’environnement et de faire (éventuellement un très grand nombre) d’erreurs. Bien que cela puisse être un facteur limitant dans certaines applications, des environnements de RL simples, comme les environnements de bandit, peuvent encore accueillir une variété de problèmes pour l’apprentissage interactif de comportements. Dans d’autres situations, la simulation peut être la clé. Dans cet exposé, nous montrerons que le RL peut être utilisé pour formuler et résoudre des problèmes d’acquisition de données (imagerie) en neurosciences. Nous verrons comment les méthodes de bandit peuvent être utilisées pour optimiser l’imagerie de super-résolution en apprenant sur des dispositifs réels à travers un processus empirique réel. Nous verrons également comment la simulation peut être exploitée pour apprendre des stratégies de prise de décision plus séquentielles. Ces applications soulignent le potentiel du RL pour aider les utilisateurs experts dans des tâches difficiles et permettre de nouvelles découvertes.
Pour participer à la conférence ZOOM:
https://uqtr.zoom.us/j/89117750390?pwd=dVltelRydUtlc2RvSWNWa1hMM1IxUT09
Attention: Cette activité peut être enregistrée. Merci de ne pas y accéder si vous ne voulez pas être enregistré.
ID de réunion : 891 1775 0390
Mot de passe : 400569