https://github.com/floattech/chatgpt-dataset-collect
此仓库用于收集一些文本数据作为训练chatGPT-Alpha的数据集,人人可以pr自己的文本数据到此仓库中
https://github.com/floattech/chatgpt-dataset-collect
Last synced: 5 months ago
JSON representation
此仓库用于收集一些文本数据作为训练chatGPT-Alpha的数据集,人人可以pr自己的文本数据到此仓库中
- Host: GitHub
- URL: https://github.com/floattech/chatgpt-dataset-collect
- Owner: FloatTech
- License: mit
- Created: 2022-12-30T04:41:17.000Z (about 3 years ago)
- Default Branch: main
- Last Pushed: 2022-12-30T04:53:42.000Z (about 3 years ago)
- Last Synced: 2025-06-04T11:22:17.309Z (8 months ago)
- Size: 3.91 KB
- Stars: 2
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# chatGPT-Dataset-collect
此仓库用于收集一些文本数据作为训练chatGPT-Alpha的数据集,人人可以pr自己的文本数据到此仓库中
# 请注意pr的数据要求:(由于数据集直接送入网络训练,请贡献者严格遵守以下规定!)
- 禁止出现色情,暴力等违法不文明内容
- 可以适当根据自己的喜好添加
- 根据自己提交的文本文件分类放进此仓库
- 文件必须是 `.txt`的文本文件
- 提交数据时请以内容的分类为文件名称
- 数据内容可以是聊天对话的形式(最好)
- 数据内容也可以是文章(注意分类放入合适的文件夹中)
# pr内容示例:
```
pr标题: 关于xxx的数据
pr内容:数据集形式: (对话/文章)
内容类型:
```
## 最后, 感谢各位的贡献数据!!为了GPT模型的训练一起努力吧!!