https://github.com/digoal/postgres_finetuning_kb
PostgreSQL's knowledge base for LLM fine tuning.
https://github.com/digoal/postgres_finetuning_kb
Last synced: 4 months ago
JSON representation
PostgreSQL's knowledge base for LLM fine tuning.
- Host: GitHub
- URL: https://github.com/digoal/postgres_finetuning_kb
- Owner: digoal
- License: apache-2.0
- Created: 2024-07-27T14:36:25.000Z (11 months ago)
- Default Branch: main
- Last Pushed: 2024-08-06T15:12:46.000Z (10 months ago)
- Last Synced: 2025-01-02T21:39:21.598Z (5 months ago)
- Size: 33.2 KB
- Stars: 11
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# postgres_finetuning_kb
PostgreSQL's knowledge base for LLM fine tuning.
Let's contribute Postgres's QA used for LLM fine tuning.
The goal of this project is to train an expert-level AI small model for PostgreSQL, making it more accessible to a wider audience.# 项目收益
1、通过微调之后, 可以产出模型适配文件、发布生成新的模型.
2、新的模型可被广泛应用于DBA的自我革命产品:
- 助手
- 教学
- 诊断
- SQL审查
- 数据库健康报告解读
- ... 更多模型应用等你发掘.
高并发的业务可以启用基于规则判断的产品(类比鳄鱼脑), 低并发的复杂业务可以启用基于AI和推理能力的产品(类比理性脑).
# 微调方法
参考: https://github.com/digoal/blog/blob/master/202407/20240724_01.md
# 加入我们
这个项目需要大量理论、实践经验丰富的老专家, 以及一些算力投入. 为了让项目更好的运行下去我决定成立一个虚拟组织“DBA发展联盟”, 有兴趣的朋友可以加我的微信拉大家加入组织.

# QA reference prompt
生成好的问题和答案参考:
- https://github.com/digoal/blog/blob/master/202407/20240730_01.md
- https://github.com/digoal/blog/blob/master/202408/20240806_02.md据说微调要达到比较好的效果, 至少需要1000条QA. 大家一起加油吧.
## 1、使用模型生成问题和内容
1、Q1 市面上有哪些`PostgreSQL`开源数据库相关的职业或岗位?
2、Q2 要成为一名优秀的`xxx`, 需要掌握哪些知识点?
3、Q3 要考察`PostgreSQL` `xxx`职业或岗位的应聘者是否已深刻掌握`xxx`知识点, 可以提出哪些连贯性问题(每个问题尽可能是对前一个问题的追问和深入探究), 问题的难度请标记为初级、中级、高级.
请给出问题即可, 不需要给出答案. 问题请以如下开头:
```
where is the // 去哪里找资料/代码
What is // 名词/原理解释
What is the difference // 热门的差异化对比问题
why // 为什么
how to // 怎么做、如何实现、如何解决
```
## 2、目录格式
```
job_$name/skill_$name/qa_$level_$number.md
job_职业名称/skill_知识点名称/skill_难度(l|m|h)_问题编号(001).md
```
## 3、QA markdown 文件内容格式
```
## 职业
...
## 知识点
...
## 问题难度(l|m|h)
...
## 关联问题
...
## 问题
...
## 答案
...
## 校对信息
校对人1, 校对时间
...
```