https://github.com/sadevans/halfcheetah
RL algorithms: ppo, ddpg
https://github.com/sadevans/halfcheetah
ddpg half-cheetah ppo reinforcement-learning reinforcement-learning-algorithms
Last synced: 4 months ago
JSON representation
RL algorithms: ppo, ddpg
- Host: GitHub
- URL: https://github.com/sadevans/halfcheetah
- Owner: sadevans
- Created: 2024-02-22T17:14:28.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2024-02-26T08:40:03.000Z (over 1 year ago)
- Last Synced: 2025-01-19T00:46:30.737Z (5 months ago)
- Topics: ddpg, half-cheetah, ppo, reinforcement-learning, reinforcement-learning-algorithms
- Language: Python
- Homepage:
- Size: 1.79 MB
- Stars: 0
- Watchers: 1
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# HalfCheetah
Имплементация алгоритмов DDPG и PPO.
Обучение и тестирование в среде [Half-Cheetah](https://robotics.farama.org/envs/MaMuJoCo/ma_half_cheetah/) из MuJoCo.
Статья про PPO, по которой писался алгоритм: https://arxiv.org/pdf/1707.06347.pdf
# Запуск
Для запуска обучения алгоритма DDPG:
```python
python3 train_ddpg.py
```Для запуска обучения алгоритма PPO:
```python
python3 train_ppo.py
```# Результат
На данный момент удалось достичь такого результата с помощью алгоритма PPO. Требуется доработка алгоритма и более тщательный подбор гиперпараметров.https://github.com/sadevans/HalfCheetah/assets/82286355/d97b2ffa-85f7-495f-af06-2864927792f4
# Дальнейшее развитие
- TRPO
- SAC
- A3C