https://github.com/chenxingqiang/recent_reinforcement_learning_view

强化学习专栏 focusing on 第一节数据处理与分析, 第二节推理部分, 第二节未来展望, 第一节边缘计算概述, 第二节项目实战.
https://github.com/chenxingqiang/recent_reinforcement_learning_view

ai api artificial-intelligence deep-learning learning neural-network recent reinforcement research view web

Last synced: 5 months ago
JSON representation

强化学习专栏 focusing on 第一节数据处理与分析, 第二节推理部分, 第二节未来展望, 第一节边缘计算概述, 第二节项目实战.

Host: GitHub
URL: https://github.com/chenxingqiang/recent_reinforcement_learning_view
Owner: chenxingqiang
Created: 2019-06-08T11:27:54.000Z (about 7 years ago)
Default Branch: master
Last Pushed: 2024-07-30T07:11:21.000Z (almost 2 years ago)
Last Synced: 2025-06-14T02:05:24.978Z (about 1 year ago)
Topics: ai, api, artificial-intelligence, deep-learning, learning, neural-network, recent, reinforcement, research, view, web
Size: 11.7 KB
Stars: 2
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# Recent Reinforcement Learning View
强化学习专栏

## 编外篇
### 第零周：数据科学，从计算到推理

## 第一部分强化学习理论探索专题

### 第一节理论和计算部分
1. 第一周：强化学习基础概念
2. 第二周：强化学习理论宗派
3. 第三周：强化学习与监督学习
4. 第四周：强化学习的实验环境
5. 第五周：强化学习中的数学基础
6. 第六周：强化学习中优化策略
7. 第七周：强化学习中的实验环境构建

### 第二节推理部分
8. 第八周：强化学习基本算法
9. 第九周：最优价值算法 Q-learning 和 DQN 算法
10. 第十周：基于策略梯度的算法
11. 第十一周：稀疏回报求解和 Model-based 算法
12. 第十二周：反向强化学习算法

## 第二部分强化学习应用场景专题

### 第一节经典应用场景
13. 第十三周：强化学习在 AlphaZero 中的应用
14. 第十四周：强化学习与推荐检索系统
15. 第十五周：强化学习与无人驾驶
16. 第十六周：强化学习与对战游戏
17. 第十七周：强化学习与路径规划和飞行控制
18. 第十八周：强化学习与动态规划
19. 第十九周：强化学习与量化交易
20. 第二十周：强化学习与自然语言处理
21. 第二十一周：强化学习在 AutoML 中的应用
22. 第二十二周：强化学习与机器人控制

### 第二节新兴应用场景
23. 第二十三周：强化学习与智能医疗
24. 第二十四周：强化学习与智能城市
25. 第二十五周：强化学习与智能制造
26. 第二十六周：强化学习与环境保护
27. 第二十七周：强化学习与空间探索
28. 第二十八周：强化学习与金融科技
29. 第二十九周：强化学习与智能农业
30. 第三十周：强化学习与网络安全

## 第三部分强化学习编程实践专题

### 第一节背景介绍与基础实践
31. 第三十一周：What is Reinforcement Learning
32. 第三十二周：OpenAI gym
33. 第三十三周：OpenAI Gym API
34. 第三十四周：DeepLearning with PyTorch
35. 第三十五周：The Cross-Entropy Methods
36. 第三十六周：Tabular Learning and the Bellman Equation
37. 第三十七周：Deep Q-networks
38. 第三十八周：DQN extensions
39. 第三十九周：stocks trading using RL
40. 第四十周：Policy Gradients: an alternative

### 第二节深度应用与项目实践
41. 第四十一周：The Actor-Critic Methods
42. 第四十二周：Asynchronous Advantage Actor-Critic
43. 第四十三周：Chatbot Training with RL
44. 第四十四周：Web Navigation
45. 第四十五周：Continuous Action Space
46. 第四十六周：Trust regions--TRPO，PPO，and ACKTR
47. 第四十七周：Black-box Optimization in RL
48. 第四十八周：Beyond Model-Free -- Imagination
49. 第四十九周：An on Atari Breakout
50. 第五十周：AlphaGO Zero

## 第四部分强化学习前沿论文专题

### 第一节开创性研究
51. 第五十一周：开山鼻祖 DQN 系列
52. 第五十二周：基于策略梯度的深度强化学习
53. 第五十三周：分层 Deep Reinforcement Learning
54. 第五十四周：Deep Reinforcement Learning 多任务和迁移学习

### 第二节最新进展与挑战
55. 第五十五周：基于外部记忆模块的 Deep Reinforcement Learning
56. 第五十六周：Deep Reinforcement Learning 中探索和利用问题
57. 第五十七周：多 Agent Deep Reinforcement Learning 问题
58. 第五十八周：逆向深度强化学习专题
59. 第五十九周：探索和监督学习
60. 第六十周：异步深度强化学习
61. 第六十一周：强化学习与模仿学习

## 第五部分强化学习与深度学习交叉领域探索综述专题

### 第一节交叉研究综述
62. 第六十二周：强化学习与 GCN 交叉研究综述
63. 第六十三周：强化学习与 CNN 交叉研究综述
64. 第六十四周：强化学习与 RNN 交叉研究综述
65. 第六十五周：强化学习与 AutoML 交叉研究综述

### 第二节实践与应用案例
66. 第六十六周：强化学习与GAN交叉研究综述
67. 第六十七周：强化学习与迁移学习热点综述
68. 第六十八周：强化学习与模仿学习热点综述
69. 第六十九周：反向强化学习热点综述
70. 第七十周：强化学习未来发展方向综述

## 第六部分强化学习在特定领域的应用探索

### 第一节领域探索
71. 第七十一周：强化学习在医疗领域的应用
72. 第七十二周：强化学习在教育领域的应用
73. 第七十三周：强化学习在能源管理中的应用
74. 第七十四周：强化学习在交通管理中的应用
75. 第七十五周：强化学习在客户服务中的应用
76. 第七十六周：强化学习在物流与供应链管理中的应用

### 第二节项目与案例分析
77. 第七十七周：医疗领域中的强化学习案例分析
78. 第七十八周：教育领域中的强化学习案例分析
79. 第七十九周：能源管理中的强化学习案例分析
80. 第八十周：交通管理中的强化学习案例分析
81. 第八十一周：客户服务中的强化学习案例分析
82. 第八十二周：物流与供应链管理中的强化学习案例分析

## 第七部分强化学习编程实践专题进阶

### 第一节深度学习与强化学习融合实践
83. 第八十三周：深度 Q 网络（DQN）详解
84. 第八十四周：DQN 的优化与扩展
85. 第八十五周：基于策略梯度的方法
86. 第八十六周：Actor-Critic 方法详解
87. 第八十七周：基于 A3C 的并行计算

### 第二节强化学习在现实世界中的应用
88. 第八十八周：强化学习在自动驾驶中的应用
89. 第八十九周：强化学习在智能交通中的应用
90. 第九十周：强化学习在机器人控制中的应用
91. 第九十一周：强化学习在智能制造中的应用
92. 第九十二周：强化学习在金融科技中的应用

## 第八部分强化学习的前沿研究与未来展望

### 第一节前沿研究综述
93. 第九十三周：深度强化学习中的探索策略
94. 第九十四周：基于模型的强化学习
95. 第九十五周：分层强化学习
96. 第九十六周：多任务强化学习
97. 第九十七周：迁移学习与强化学习的结合

### 第二节未来展望
98. 第九十八周：强化学习的伦理问题
99. 第九十九周：强化学习与人类学习的对比
100. 第一百周：强化学习与神经科学的联系
101. 第一百零一周：强化学习的工业应用前景
102. 第一百零二周：强化学习与人工智能的未来

## 第九部分强化学习的应用工具与框架

### 第一节工具与框架介绍
103. 第一百零三周：强化学习工具箱
104. 第一百零四周：OpenAI Gym 详解
105. 第一百零五周：使用 PyTorch 进行强化学习
106. 第一百零六周：使用 TensorFlow 进行强化学习

### 第二节项目实战
107. 第一百零七周：构建自己的强化学习环境
108. 第一百零八周：强化学习项目实战
109. 第一百零九周：强化学习在游戏中的应用
110. 第一百一十周：强化学习在机器人控制中的应用

## 第十部分强化学习与大数据的结合

### 第一节数据处理与分析
111. 第一百一十一周：大数据在强化学习中的应用
112. 第一百一十二周：数据预处理与清洗
113. 第一百一十三周：数据增强技术
114. 第一百一十四周：数据分析与可视化

### 第二节项目实战
115. 第一百一十五周：强化学习与大数据的融合案例
116. 第一百一十六周：数据驱动的强化学习项目

117. 第一百一十七周：大数据环境下的强化学习优化

## 第十一部分强化学习与边缘计算

### 第一节边缘计算概述
118. 第一百一十八周：边缘计算简介
119. 第一百一十九周：边缘计算在强化学习中的应用

### 第二节项目实战
120. 第一百二十周：边缘设备上的强化学习项目

---

### 参考文献
1. Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning: An Introduction. MIT Press.
2. Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., ... & Hassabis, D. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533.
3. Silver, D., Huang, A., Maddison, C. J., Guez, A., Sifre, L., Van Den Driessche, G., ... & Hassabis, D. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484-489.
4. Lillicrap, T. P., Hunt, J. J., Pritzel, A., Heess, N., Erez, T., Tassa, Y., ... & Wierstra, D. (2016). Continuous control with deep reinforcement learning. arXiv preprint arXiv:1509.02971.
5. Schulman, J., Wolski, F., Dhariwal, P., Radford, A., & Klimov, O. (2017). Proximal policy optimization algorithms. arXiv preprint arXiv:1707.06347.
6. Levine, S., Pastor, P., Krizhevsky, A., Ibarz, J., & Quillen, D. (2018). Learning hand-eye coordination for robotic grasping with deep learning and large-scale data collection. The International Journal of Robotics Research, 37(4-5), 421-436.
7. Van Hasselt, H., Guez, A., & Silver, D. (2016). Deep reinforcement learning with double Q-learning. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 30, No. 1).
8. Bellemare, M. G., Naddaf, Y., Veness, J., & Bowling, M. (2013). The arcade learning environment: An evaluation platform for general agents. Journal of Artificial Intelligence Research, 47, 253-279.
9. Brockman, G., Cheung, V., Pettersson, L., Schneider, J., Schulman, J., Tang, J., & Zaremba, W. (2016). OpenAI gym. arXiv preprint arXiv:1606.01540.
10. Henderson, P., Islam, R., Bachman, P., Pineau, J., Precup, D., & Meger, D. (2018). Deep reinforcement learning that matters. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 32, No. 1).

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/chenxingqiang/recent_reinforcement_learning_view

Awesome Lists containing this project

README