An open API service indexing awesome lists of open source software.

https://github.com/luckyzxl2016/reinforcement-learning

Reinforcement Learning学习之路
https://github.com/luckyzxl2016/reinforcement-learning

machine-learning python reinforcement-learning

Last synced: over 1 year ago
JSON representation

Reinforcement Learning学习之路

Awesome Lists containing this project

README

          

# 强化学习的博客及配套代码
记录自己强化学习由浅入深的学习过程,目前主要参考的资料是David Silver的公开课,下面提到的代码有部分源于网络。

## [目录](#目录)
- [强化学习博客与代码](#强化学习博客与代码)

## 强化学习博客与代码:
|**博客** | **代码** |
| --------------------------------------------------------------------------------------------- |:-------------:|
| [强化学习-术语和数学符号](https://blog.csdn.net/u011254180/article/details/84031546) | 无 |
| [强化学习(一)简介](https://blog.csdn.net/u011254180/article/details/83349455) | 无 |
| [强化学习(二)马尔科夫决策过程](https://blog.csdn.net/u011254180/article/details/83387344) | 无 |
| [强化学习(三)动态规划寻找最优策略](https://blog.csdn.net/u011254180/article/details/83573220) | 无 |
| [强化学习(四)不基于模型的预测](https://blog.csdn.net/u011254180/article/details/83994391) | 无 |
| [强化学习(五)不基于模型的控制](https://blog.csdn.net/u011254180/article/details/84253095) | 无 |
| [强化学习实践(一)Tic-Tac-Toe游戏](https://blog.csdn.net/u011254180/article/details/86479795) | [代码](/01-blog_code/Tic-Tac-Toe/example.py) |
| [强化学习实践(二)迭代法评估4\*4方格世界下的随机策略](https://blog.csdn.net/u011254180/article/details/88133551) | [代码](/01-blog_code/Gridworld/gridworld.py) |
| [强化学习实践(三)理解gym的建模思想](https://blog.csdn.net/u011254180/article/details/88211536) | 无 |
| [强化学习实践(四)编写通用的格子世界环境类](https://blog.csdn.net/u011254180/article/details/88220484) | [代码](/01-blog_code/Gridworld2/gridworld2.py) |
| [强化学习实践(五)Agent类和SARSA算法实现](https://blog.csdn.net/u011254180/article/details/88430601) | [代码](/01-blog_code/sarsa/sarsa.py) |
| [强化学习实践(六)SARSA(λ)算法实现](https://blog.csdn.net/u011254180/article/details/88673519) | [代码](/01-blog_code/sarsa/sarsa(lambda).py) |
| [强化学习(六)价值函数的近似表示](https://blog.csdn.net/u011254180/article/details/89238765) | 无 |
| [强化学习实践(七)给Agent添加记忆功能](https://blog.csdn.net/u011254180/article/details/89326920) | [代码](/01-blog_code/core/core.py) |
| [强化学习(七)策略梯度](https://blog.csdn.net/u011254180/article/details/89431822) | 无 |
| [强化学习(八)整合学习与规划](https://blog.csdn.net/u011254180/article/details/89556617) | 无 |
| [强化学习(九)探索与利用](https://blog.csdn.net/u011254180/article/details/90063387) | 无 |
| [强化学习实践(八)DQN的实现](https://blog.csdn.net/u011254180/article/details/90240163) | [代码](/01-blog_code/dqn/approxagent.py) |