An open API service indexing awesome lists of open source software.

https://github.com/Mxoder/LLM-from-scratch

一些 LLM 方面的从零复现笔记
https://github.com/Mxoder/LLM-from-scratch

Last synced: 12 months ago
JSON representation

一些 LLM 方面的从零复现笔记

Awesome Lists containing this project

README

          

# LLM-from-scratch

一些 LLM 的从零复现笔记,包括一些思考文章。

- [x] 1. 从头预训练一只超迷你 LLaMA 3——复现 TinyStories
- [x] 2. 用 PyTorch 从零实现 LoRA
- [ ] 3. 从零实现 `generate` 方法

## 知乎链接

1. [从头预训练一只超迷你 LLaMA 3——复现 TinyStories](https://zhuanlan.zhihu.com/p/695130168)

2. [用 PyTorch 从零实现 LoRA](https://zhuanlan.zhihu.com/p/702419731)

3. [Qwen2.5-Math 技术报告详细解读](https://zhuanlan.zhihu.com/p/721015204)

4. [Qwen2.5-Coder 技术报告详细解读](https://zhuanlan.zhihu.com/p/721189499)

5. [我的 api 调用太慢了!LLM api 的异步调用加速](https://zhuanlan.zhihu.com/p/1896894945463362125)

6. [Qwen3是如何实现混合推理(快慢思考)的?](https://zhuanlan.zhihu.com/p/1900555481715570305)