https://github.com/changyeyu/LLM-RL-Visualized
🌟100+ 原创 LLM / RL 原理图📚,《大模型算法》作者巨献🎉 (100+ LLM/RL Algorithm Maps )
https://github.com/changyeyu/LLM-RL-Visualized
algorithm deeplearning llm nlp-machine-learning reinforcement-learning vlm
Last synced: 3 months ago
JSON representation
🌟100+ 原创 LLM / RL 原理图📚,《大模型算法》作者巨献🎉 (100+ LLM/RL Algorithm Maps )
- Host: GitHub
- URL: https://github.com/changyeyu/LLM-RL-Visualized
- Owner: changyeyu
- License: other
- Created: 2025-04-26T14:30:47.000Z (6 months ago)
- Default Branch: master
- Last Pushed: 2025-07-06T11:38:56.000Z (4 months ago)
- Last Synced: 2025-07-06T12:40:04.206Z (4 months ago)
- Topics: algorithm, deeplearning, llm, nlp-machine-learning, reinforcement-learning, vlm
- Language: Python
- Homepage: https://book.douban.com/subject/37331056/
- Size: 122 MB
- Stars: 432
- Watchers: 7
- Forks: 56
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
- awesome-LLM-resources - 100+ LLM & RL Algorithm Maps | 原创 LLM / RL 100+原理图
- StarryDivineSky - changyeyu/LLM-RL-Visualized - 解码器结构,或用动态流程图演示强化学习中的奖励机制与策略更新过程。 项目采用Python实现可视化生成,支持通过Jupyter Notebook交互式查看,部分图表包含动态参数调整功能,帮助用户直观理解算法运行逻辑。源码结构清晰,包含完整注释和教学案例,适合算法学习者从零构建可视化模型。特别针对LLM的预训练与微调过程、RL的环境交互机制等易混淆知识点,设计了对比式图示进行解析。项目同时提供算法原理与代码实现的对应关系说明,便于开发者将理论知识转化为实践应用。作为学习工具,它既可作为算法入门的视觉化指南,也适合作为研究人员和工程师的算法设计参考,尤其适合需要快速掌握LLM与RL核心思想的技术从业者。 (A01_文本生成_文本对话 / 大语言对话模型及数据)