Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/keli-wen/agi-study
The blog and read report for AGI/LLM related knowledge.
https://github.com/keli-wen/agi-study
code-examples demo inference-optimization llm train
Last synced: about 1 month ago
JSON representation
The blog and read report for AGI/LLM related knowledge.
- Host: GitHub
- URL: https://github.com/keli-wen/agi-study
- Owner: keli-wen
- Created: 2024-01-22T12:10:48.000Z (10 months ago)
- Default Branch: master
- Last Pushed: 2024-04-12T14:47:09.000Z (7 months ago)
- Last Synced: 2024-04-12T22:22:21.015Z (7 months ago)
- Topics: code-examples, demo, inference-optimization, llm, train
- Language: Python
- Homepage:
- Size: 3.48 MB
- Stars: 5
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# AGI-Study
🎯 Be a good Deep Learning Engineer. (大量施工👷)
## Code-Examples
- [x] [`chat-llm-v1`](https://github.com/keli-wen/AGI-Study/tree/master/code-examples/chat-llm-v1):基于 `PyTriton`,`Streamlit` 和 `DeepSeek` 制作的最简化 Chat Project。
- [ ] `chat-llm-v2`:基于 `chat-llm-v1` 制作的 `vision language` 版本,并优化了多模型选择,dynamic batching 和 streaming output 等新特性。(施工中)## Environment
> 这部分主要介绍 DL 环境配置相关的内容。
- [x] [**CUDA** Related Env Config](https://github.com/keli-wen/AGI-Study/blob/master/env/cuda-related/):介绍 GPU Driver Version,Cuda Toolkit Version 的更新。包括多 Cuda 版本管理等。
- [ ] [**Docker** Related Env Config](https://github.com/keli-wen/AGI-Study/blob/master/env/docker-related/):Docker 的基本使用教程(菜鸟教程)。## Train
> 这部分主要介绍当前 LLM 中常用的 Training 框架以及相关知识点。
- [ ] `PYTORCH LIGHTNING` 入门介绍(低优先级)
- [ ] DeepSpeed 介绍:
- [ ] DeepSpeed -- ZeRO 原理介绍(见知乎,待搬运)。
- [ ] DeepSpeed 实战(环境配置,Example)(TODO,Low Priority)[Refer: DeepSpeed PR](https://github.com/microsoft/DeepSpeedExamples/pull/843).## Tokenizer
- [x] Byte-Pair Encoding 算法解读。
- [ ] Google SentencePiece 库使用介绍。## Inference & Deploy
> 这部分主要介绍推理优化和部署相关的内容。
>
> - **🤔Q: What's the Inference Optimization?**
> - **📖A:** Inference optimization refers to **the process of enhancing the efficiency and speed at which LLMs analyze data and generate responses**. This process is crucial for practical applications, as it directly impacts the model's performance and usability.- [x] [`Basic-LLM-Inference.md`](https://github.com/keli-wen/AGI-Study/blob/master/inference/Basic-LLM-Inference.md):基于 meta-llama 介绍基础的 LLM Inference pipeline。
- [ ] `Batch-Inference-Optimization.md`:(施工中)Basic 的进阶版。
- [ ] `vLLM`: (施工中)介绍 `vLLM` 的使用,**以及后续的 `vLLM` 核心原理和代码的探索。**
- [ ] `TensorRT-LLM`:目前是非常简单的介绍了 `TensorRT-LLM` 的使用信息。
- [x] `Mixture of Depth`:关于 MoD 的最新介绍,Transformer-based 模型的动态算力分配。
- [ ] `Nvidia Triton Inference Server`:首先进行工具扫盲,然后主要从应用的角度介绍这个工具的使用。
- [ ] `Quantization in LLM`:(施工中)## Demo
> 这部分主要介绍 DEMO 制作相关的经验。
- [x] `FastAPI`: 介绍 `FastAPI` 的基本信息,以及它如何应用在 LLM 相关的 DEMO 原型中。
- [ ] `Streamlit`:介绍如何 `Streamlit` 如何使用,并定制化自己的 DEMO 前端。## Visualization
开源一些可视化的资源。