An open API service indexing awesome lists of open source software.

https://github.com/redleader962/t13-deep-learning-project


https://github.com/redleader962/t13-deep-learning-project

Last synced: about 1 year ago
JSON representation

Awesome Lists containing this project

README

          

# Exploration de la redistribution de récompenses en apprentissage par renforcement
par [Luc Coupal](https://redleader962.github.io), [Francois-Alexandre Tremblay](https://www.linkedin.com/in/francois-alexandre-tremblay-m-sc-2b212146/) et [William-Ricardo Bonilla-Villatoro](william-ricardo.bonilla-villatoro.1@ulaval.ca)

Projet d'expérimentation lié à l'article ***"RUDDER: Return Decomposition for Delayed Rewards"*** écrit par *Arjona-Medina, J. A.* et *al.* dans le cadre du cours **GLO-7030 Apprentissage par réseaux de neurones profonds** donné à l'[Université Laval](https://www.fsg.ulaval.ca), Qc, Canada.

[Télécharger le PDF](https://github.com/RedLeader962/T13-Deep-Learning-Project/raw/master/T13_Deep_Learning_Project_Report-v1.pdf) du rapport d'expérimentation.

Pour un survol rapide des concepts clés liés à l'article, visionner notre présentation orale
[Une intuition sur *RUDDER* (*Return Decomposition for Delayed Rewards*)](https://youtu.be/2xH1TjVt9I8) sur ***YouTube*** (6 min 24 sec).
Les **diapositives** de la présentation orale sont disponibles [ici](https://github.com/RedLeader962/Une-intuition-sur-RUDDER).