An open API service indexing awesome lists of open source software.

https://github.com/zhaoyingjun/general

Alignment成为GPT类大模型微调的必须环节,深度强化学习是Alignment的核心。本项目是一个支持非gym环境训练、支持可视化配置的深度强化学习应用编程框架,30分钟上手强化学习编程。
https://github.com/zhaoyingjun/general

ddpg deep-reinforcement-learning dqn gui gym ppo tensorflow2

Last synced: 6 months ago
JSON representation

Alignment成为GPT类大模型微调的必须环节,深度强化学习是Alignment的核心。本项目是一个支持非gym环境训练、支持可视化配置的深度强化学习应用编程框架,30分钟上手强化学习编程。

Awesome Lists containing this project