https://github.com/zozero/a3c-super-mario

强化学习之超级马里奥，异步优势行动者与评论家
https://github.com/zozero/a3c-super-mario

a3c ai pytorch rl

Last synced: about 1 month ago
JSON representation

强化学习之超级马里奥，异步优势行动者与评论家

Host: GitHub
URL: https://github.com/zozero/a3c-super-mario
Owner: zozero
License: mit
Created: 2022-12-05T10:48:43.000Z (over 3 years ago)
Default Branch: master
Last Pushed: 2022-12-05T10:55:32.000Z (over 3 years ago)
Last Synced: 2025-11-08T01:19:11.132Z (7 months ago)
Topics: a3c, ai, pytorch, rl
Language: Python
Homepage:
Size: 12 MB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

# 超级马里奥
### 异步优势行动者与评论家
## 关于程序
很有趣的项目，但训练需要很长时间，训练花了10个小时左右。\
没有训练完善的网络模型测试时会卡在某个柱子前，或者某个台阶上，经过很长很长时间后它才学会跳过去......\
命名都为中文，尽可能地贴近其所描述的含义。\
中英文对照：异步优势行动者与评论家(A3C,Asynchronous Advantage Actor-critic)。\
是我仿照自《强化学习实战系列（2020最新）》唐老师的视频课程。
## 文件说明
《训练.py》这里是用来训练的。\
《测试.py》这里是用来训练的。\
《超级马里奥_1_1_已完成》这是我训练好的模型，它在《已训练的模型》目录下。\
《强化学习之异步优势行动者与评论家.docx》这个文件里面是基础的数学公式，我有对公式的组成进行说明。你可能不会理解我写了什么，事实上我重读的时候也是这样：）。
## 注意事项
你需要安装[Gym](https://www.gymlibrary.dev/)，[gym-super-mario-bros](https://github.com/Kautenja/gym-super-mario-bros)（专用于马里奥游戏的库）。\
如果在win11系统下保存出现乱码或者报错，请参考[链接](https://blog.csdn.net/wry15082983136/article/details/126229608)的方法。\
使用tensorboardX需要安装tensorflow，在控制台执行命令python -m tensorboard.main --logdir=./张量板/超级马里奥。
## 其他
一个用于使用中文编程，很好用的pycharm插件[链接](https://github.com/tuchg/ChinesePinyin-CodeCompletionHelper)。

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/zozero/a3c-super-mario

Awesome Lists containing this project

README