https://github.com/sadevans/halfcheetah

RL algorithms: ppo, ddpg
https://github.com/sadevans/halfcheetah

ddpg half-cheetah ppo reinforcement-learning reinforcement-learning-algorithms

Last synced: about 1 month ago
JSON representation

RL algorithms: ppo, ddpg

Host: GitHub
URL: https://github.com/sadevans/halfcheetah
Owner: sadevans
Created: 2024-02-22T17:14:28.000Z (over 2 years ago)
Default Branch: main
Last Pushed: 2024-02-26T08:40:03.000Z (over 2 years ago)
Last Synced: 2025-03-12T10:22:34.273Z (over 1 year ago)
Topics: ddpg, half-cheetah, ppo, reinforcement-learning, reinforcement-learning-algorithms
Language: Python
Homepage:
Size: 1.79 MB
Stars: 0
Watchers: 1
Forks: 1
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# HalfCheetah

Имплементация алгоритмов DDPG и PPO.

Обучение и тестирование в среде [Half-Cheetah](https://robotics.farama.org/envs/MaMuJoCo/ma_half_cheetah/) из MuJoCo.

Статья про PPO, по которой писался алгоритм: https://arxiv.org/pdf/1707.06347.pdf

# Запуск
Для запуска обучения алгоритма DDPG:
```python
python3 train_ddpg.py
```

Для запуска обучения алгоритма PPO:
```python
python3 train_ppo.py
```

# Результат
На данный момент удалось достичь такого результата с помощью алгоритма PPO. Требуется доработка алгоритма и более тщательный подбор гиперпараметров.

https://github.com/sadevans/HalfCheetah/assets/82286355/d97b2ffa-85f7-495f-af06-2864927792f4

# Дальнейшее развитие
- TRPO
- SAC
- A3C

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/sadevans/halfcheetah

Awesome Lists containing this project

README