https://github.com/kengz/SLM-Lab

Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".
https://github.com/kengz/SLM-Lab

a2c a3c benchmark deep-reinforcement-learning dqn policy-gradient ppo pytorch reinforcement-learning sac

Last synced: 13 days ago
JSON representation

Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".

Host: GitHub
URL: https://github.com/kengz/SLM-Lab
Owner: kengz
License: mit
Created: 2017-10-02T22:20:22.000Z (over 7 years ago)
Default Branch: master
Last Pushed: 2025-02-16T01:19:34.000Z (about 2 months ago)
Last Synced: 2025-03-31T17:06:49.561Z (14 days ago)
Topics: a2c, a3c, benchmark, deep-reinforcement-learning, dqn, policy-gradient, ppo, pytorch, reinforcement-learning, sac
Language: Python
Homepage: https://slm-lab.gitbook.io/slm-lab/
Size: 4.08 MB
Stars: 1,276
Watchers: 46
Forks: 274
Open Issues: 16
Metadata Files:
- Readme: README.md
- License: LICENSE
- Code of conduct: CODE_OF_CONDUCT.md

Awesome Lists containing this project

awesome-deep-rl - SLM Lab - Modular Deep Reinforcement Learning framework in PyTorch. (Libraries)
Awesome-pytorch-list-CNVersion - SLM-Lab
Awesome-pytorch-list - SLM-Lab

README

        # SLM Lab 
 ![GitHub tag (latest SemVer)](https://img.shields.io/github/tag/kengz/slm-lab) ![CI](https://github.com/kengz/SLM-Lab/workflows/CI/badge.svg) [![Maintainability](https://api.codeclimate.com/v1/badges/20c6a124c468b4d3e967/maintainability)](https://codeclimate.com/github/kengz/SLM-Lab/maintainability) [![Test Coverage](https://api.codeclimate.com/v1/badges/20c6a124c468b4d3e967/test_coverage)](https://codeclimate.com/github/kengz/SLM-Lab/test_coverage)



  Modular Deep Reinforcement Learning framework in PyTorch.

  



  Documentation:


  https://slm-lab.gitbook.io/slm-lab/

  





>NOTE: the `book` branch has been updated for issue fixes. For the original code in the book _Foundations of Deep Reinforcement Learning_, check out to git tag `v4.1.1`

|||||

|:---:|:---:|:---:|:---:|

| ![ppo beamrider](https://user-images.githubusercontent.com/8209263/63994698-689ecf00-caaa-11e9-991f-0a5e9c2f5804.gif) | ![ppo breakout](https://user-images.githubusercontent.com/8209263/63994695-650b4800-caaa-11e9-9982-2462738caa45.gif) | ![ppo kungfumaster](https://user-images.githubusercontent.com/8209263/63994690-60469400-caaa-11e9-9093-b1cd38cee5ae.gif) | ![ppo mspacman](https://user-images.githubusercontent.com/8209263/63994685-5cb30d00-caaa-11e9-8f35-78e29a7d60f5.gif) |

| BeamRider | Breakout | KungFuMaster | MsPacman |

| ![ppo pong](https://user-images.githubusercontent.com/8209263/63994680-59b81c80-caaa-11e9-9253-ed98370351cd.gif) | ![ppo qbert](https://user-images.githubusercontent.com/8209263/63994672-54f36880-caaa-11e9-9757-7780725b53af.gif) | ![ppo seaquest](https://user-images.githubusercontent.com/8209263/63994665-4dcc5a80-caaa-11e9-80bf-c21db818115b.gif) | ![ppo spaceinvaders](https://user-images.githubusercontent.com/8209263/63994624-15c51780-caaa-11e9-9c9a-854d3ce9066d.gif) |

| Pong | Qbert | Seaquest | Sp.Invaders |

| ![sac ant](https://user-images.githubusercontent.com/8209263/63994867-ff6b8b80-caaa-11e9-971e-2fac1cddcbac.gif) | ![sac halfcheetah](https://user-images.githubusercontent.com/8209263/63994869-01354f00-caab-11e9-8e11-3893d2c2419d.gif) | ![sac hopper](https://user-images.githubusercontent.com/8209263/63994871-0397a900-caab-11e9-9566-4ca23c54b2d4.gif) | ![sac humanoid](https://user-images.githubusercontent.com/8209263/63994883-0befe400-caab-11e9-9bcc-c30c885aad73.gif) |

| Ant | HalfCheetah | Hopper | Humanoid |

| ![sac doublependulum](https://user-images.githubusercontent.com/8209263/63994879-07c3c680-caab-11e9-974c-06cdd25bfd68.gif) | ![sac pendulum](https://user-images.githubusercontent.com/8209263/63994880-085c5d00-caab-11e9-850d-049401540e3b.gif) | ![sac reacher](https://user-images.githubusercontent.com/8209263/63994881-098d8a00-caab-11e9-8e19-a3b32d601b10.gif) | ![sac walker](https://user-images.githubusercontent.com/8209263/63994882-0abeb700-caab-11e9-9e19-b59dc5c43393.gif) |

| Inv.DoublePendulum | InvertedPendulum | Reacher | Walker |

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/kengz/SLM-Lab

Awesome Lists containing this project

README