An open API service indexing awesome lists of open source software.

https://github.com/study8677/post-training

本仓库聚焦于大模型后训练(Post-Training),内容包括但不限于: 核心方法:SFT、RLHF、RL、DPO、RAG 其他方向:模型蒸馏、对齐方法、红队测试、安全性调优等 目标:记录和沉淀相关知识、方法与实践经验,旨在从原型 Demo 推动到实际落地应用。
https://github.com/study8677/post-training

Last synced: 4 months ago
JSON representation

本仓库聚焦于大模型后训练(Post-Training),内容包括但不限于: 核心方法:SFT、RLHF、RL、DPO、RAG 其他方向:模型蒸馏、对齐方法、红队测试、安全性调优等 目标:记录和沉淀相关知识、方法与实践经验,旨在从原型 Demo 推动到实际落地应用。

Awesome Lists containing this project

README

          

# post-training

本仓库聚焦于大模型后训练(Post-Training),涵盖 SFT、RLHF、DPO、RAG 等方法以及模型蒸馏、对齐与安全等方向。目标是记录与沉淀相关知识、方法与实践经验。

## Quick Start

```bash
make init
make test
```

## Directory

- `configs/` 项目统一配置
- `scripts/` 一键运行脚本
- `src/post_training/` 可复用的库代码
- `examples/` 最小可运行示例
- `tests/` 单元与冒烟测试

更多内容见各子目录文档。