https://github.com/mileristovski/ai-reinforcementlearning
Un projet d'apprentissage par renforcement testant divers algorithmes RL, notamment la Programmation Dynamique, Monte Carlo et l'Apprentissage par Différence Temporelle, sur plusieurs environnements comme Grid World, Monty Hall et Pierre-Papier-Ciseaux. 🚀
https://github.com/mileristovski/ai-reinforcementlearning
artifical-intelligense dynamic-programming monte-c reinforcement-learning rust temporal-differencing-learning
Last synced: about 1 month ago
JSON representation
Un projet d'apprentissage par renforcement testant divers algorithmes RL, notamment la Programmation Dynamique, Monte Carlo et l'Apprentissage par Différence Temporelle, sur plusieurs environnements comme Grid World, Monty Hall et Pierre-Papier-Ciseaux. 🚀
- Host: GitHub
- URL: https://github.com/mileristovski/ai-reinforcementlearning
- Owner: Mileristovski
- License: mit
- Created: 2024-10-08T13:23:51.000Z (over 1 year ago)
- Default Branch: master
- Last Pushed: 2025-03-14T13:19:17.000Z (about 1 year ago)
- Last Synced: 2025-03-14T14:24:07.841Z (about 1 year ago)
- Topics: artifical-intelligense, dynamic-programming, monte-c, reinforcement-learning, rust, temporal-differencing-learning
- Language: Rust
- Homepage:
- Size: 1.38 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Reinforcement Learning Algorithms
## Aperçu
Ce projet explore et teste divers **algorithmes d'Apprentissage par Renforcement (RL)** à travers plusieurs environnements. L'objectif est d'évaluer leurs performances et de comprendre leur comportement dans différents contextes.
## Fonctionnalités
- **Algorithmes RL implémentés** :
- Programmation Dynamique
- Méthodes de Monte Carlo
- Apprentissage par Différence Temporelle
- Algorithmes de Planification
- **Environnements testés** :
- Monde en Grille (Grid World)
- Monde en Ligne (Line World)
- Problème de Monty Hall (3 portes)
- Problème de Monty Hall (5 portes)
- Pierre-Papier-Ciseaux
- Environnement Secret 🚀
## Installation
1. **Cloner le dépôt** :
```bash
git clone https://github.com/Mileristovski/reinforcementLearning.git
```
2. **Se déplacer dans le répertoire du projet** :
```bash
cd reinforcementLearning/src/bin/back
```
3. **Installer les dépendances** :
```bash
cargo build --release
```
## Utilisation
1. **Exécuter un algorithme RL sur un environnement donné** :
```bash
cargo run --release
```
2. **Suivre la progression de l'entraînement** via les journaux ou les visualisations.
## Environnements Testés
- Monde en Grille (Grid World)
- Monde en Ligne (Line World)
- Problème de Monty Hall (3 portes)
- Problème de Monty Hall (5 portes)
- Pierre-Papier-Ciseaux
- Environnement Secret
## Algorithmes RL Implémentés
- Programmation Dynamique
- Méthodes de Monte Carlo
- Apprentissage par Différence Temporelle
- Algorithmes de Planification
## Contribution
Les contributions sont les bienvenues ! N'hésitez pas à forker le dépôt et à soumettre une pull request.
## Licence
Ce projet est sous licence MIT. Consultez le fichier [LICENSE](LICENSE) pour plus de détails.
---
🚀 Bon apprentissage par renforcement !