Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/DUOMO/TransGPT
https://github.com/DUOMO/TransGPT
Last synced: 6 days ago
JSON representation
- Host: GitHub
- URL: https://github.com/DUOMO/TransGPT
- Owner: DUOMO
- License: mit
- Created: 2023-07-17T01:00:16.000Z (over 1 year ago)
- Default Branch: main
- Last Pushed: 2023-09-14T11:55:09.000Z (about 1 year ago)
- Last Synced: 2024-08-02T06:19:27.360Z (3 months ago)
- Language: Python
- Size: 10.2 MB
- Stars: 695
- Watchers: 6
- Forks: 76
- Open Issues: 15
-
Metadata Files:
- Readme: README-English.md
- License: LICENSE
Awesome Lists containing this project
- Awesome-Domain-LLM - TransGPT (致远)
- StarryDivineSky - DUOMO/TransGPT
- Awesome-LLMs-Datasets - Github - Lab/TransGPT-sft)** (Instruction Fine-tuning Datasets / Domain-specific Instruction Fine-tuning Datasets)
- awesome-llm-and-aigc - TransGPT|致远
- awesome-llm-and-aigc - TransGPT|致远
README
# TransGPT
🤗 TransGPT-6B
•
🤖 DUOMO
•
中文 |
English
## 摘要
TransGPT是国内首款开源交通大模型,主要致力于在真实交通行业中发挥实际价值。它能够实现交通情况预测、智能咨询助手、公共交通服务、交通规划设计、交通安全教育、协助管理、交通事故报告和分析、自动驾驶辅助系统等功能。TransGPT作为一个通用常识交通大模型,可以为道路工程、桥梁工程、隧道工程、公路运输、水路运输、城市公共交通运输、交通运输经济、交通运输安全等行业提供通识常识。以此为基础,可以落脚到特定的交通应用场景中。
- 模型:TransGPT-7B,
- 代码:基本训练和推理代码,
- 数据:
- ~xx万条文本数据(用于领域内预训练)
- ~xx万条对话数据(用于微调)
- **开源免费可商用**:不仅对学术研究完全开放,仅需邮件申请并获得官方商用许可后,即可以免费商用。## 最新发布
- [07.18] ✨ 开源 [**TransGPT**](https://huggingface.co/??) (💼 **可商用**).
- [07.17] ✨ 开源 [**TransGPT-DATA**](https://huggingface.co/??) (💼**可商用**)## 目录
- [开源数据集](#开源数据集)
- [示例输出](#TransGPT示例输出)
- [测评](#测评)
- [模型下载](#模型下载)
- [环境部署](#环境部署)
- [训练和推理](#训练和推理)
- [其他](#声明)## 开源数据集
- 数据源包含两个部分:| 内容 | 下载地址 | 备注 |
|:-------|---------------------------------|--------|
| 预训练数据集 | [link](https://huggingface.co/??) | 非对话数据集 |
| 微调数据集 | [link](https://huggingface.co/??) | 对话式数据集 |- 数据来源
![img.png](figs/img.png)## TransGPT功能及示例输出
1. **交通安全教育**:交通大模型可以用于生成交通安全教育材料,如安全驾驶的建议、交通规则的解释等。
2. **智能助手**:在车辆中的智能助手可以使用大型交通大模型来理解和生成更自然、更复杂的对话,帮助驾驶者获取路线信息、交通更新、天气预报等。自动回答关于公共交通服务的问题,如车次、票价、路线等。这可以提高服务效率并提升乘客体验。
3. **自动驾驶辅助系统**:在自动驾驶系统中,大型交通大模型可以用于理解人类驾驶者的指令,或者生成给人类乘客的解释和提示。例如,它可以解释车辆的驾驶决策,或者在紧急情况下提供指导。
4. **交通管理**:通过实时监测和分析车辆、道路、信号灯等信息,协助智能协调交通流量,减少交通拥堵。分析社交媒体或新闻报道中的文本信息,预测交通流量、交通堵塞或事故的可能性。同时,该模型能分析交通事故历史和特征,给出相应对策和方案,减少交通事故的发生。
5. **交通规划**:交通大模型可以帮助分析公众对于交通规划提案的反馈和意见,提供决策者更全面的信息。
6. **交通事故报告和分析*:交通大模型可以帮助快速理解和分类交通事故报告,提供事故原因的初步分析。
7. **交通犯罪调查**:在交通犯罪调查中,交通大模型可以帮助理解案件报告,或者生成调查报告。例如,它可以通过分析案件报告,提供关于事故原因的初步分析。
8. **交通数据分析**:交通大模型可以帮助分析交通数据,提供交通流量的预测,或者发现可能的交通问题。例如,它可以通过分析历史数据,预测某个路口在特定时间的交通流量。
9. *交通政策研究**:大型交通大模型可以用于分析公众对于交通政策的反馈,或者生成关于交通政策影响的报告。这可以帮助政策制定者更好地了解政策的实际效果。
## 评测
我们在交通 benchmark 上进行了`zero-shot`评测,评测了交通情况预测 | 智能助手 | 公共交通服务 | 交通规划 | 交通安全教育 |事故报告和分析等方面的性能,使用GPT-4和人工评测。结果如下:
| | 交通情况预测 | 智能助手 | 公共交通服务 | 交通规划 | 交通安全教育 |事故报告和分析 |
|-------------|:--------:|:----------:|:------:|:----:|:------:|:------:|
| TransGPT-6B | | | | | | |## 模型下载
| 模型 | 下载链接 | 备注 |
|:------------|-----------------------------------|--------------------------------------------------------------------------------|
| TransGPT-6B | [link](https://huggingface.co/??) | Fine-tuned on the instruction-tuning data from part of [our data](https://?) ) |## 环境部署
#### 环境配置创建conda环境:
```
conda env create -f environment.yml
conda activate xxx
```## 使用先决条件
首先 使用 `git-lfs`下载参数:
```bash
git lfs install
git clone https://huggingface.co/??
```## 训练和推理
#### Pretraining
##### Data
* [[link](https://huggingface.co/datasets/。。)]##### Script
```
conda activate ??
??
```#### Instruction Tuning
##### Data
* [InstructBLIP](https://github.com/。。).##### Script
```
??
```## 开源数据集
## 推荐GPUs
* Pre-training: 8xA100 (80G)
* Instruction Tuning: 8xA40 (45G)
* Inference: ??Logo由[DreamStudio](https://beta.dreamstudio.ai/generate)生成🙏.
## 声明
我们强烈呼吁所有的使用者,不要利用TransGPT模型进行任何危害国家社会安全或违法的活动。除此之外,我们也要求使用者不要将TransGPT模型用于未经适当安全审查和备案的互联网服务。我们理解科技的发展必须在规范和合法的环境下进行,因此我们希望所有的使用者都能积极遵守这个原则。
我们已经尽我们所能,确保模型训练过程中所使用的数据的合规性。然而,尽管我们做出了巨大的努力,但由于模型和数据的复杂性,仍有可能存在一些无法预见的问题。因此,我们建议使用者在使用TransGPT开源模型时要谨慎行事,并遵循一些基本的安全准则,如加强数据备份、限制数据访问权限等。
当前模型可能存在生成幻觉、误导性、或歧视性内容。请谨慎使用TransGPT系列模型生成的内容,请勿将生成的有害内容进行传播。
如需将模型公开使用或者商用,模型服务所产生的不良影响或者有害言论由服务方负责,本项目开发者不承担任何因使用本项目(包含但不限于数据、模型、代码等)导致的危害或损失。
此外,我们认为,开源技术的发展需要整个社区的努力和共同维护。如果你在使用TransGPT模型的过程中发现了任何问题或有任何建议,欢迎与我们联系。我们希望通过与广大用户的合作和交流,不断提升TransGPT模型的质量和安全性,并为开源技术的长远发展做出贡献。
最后,鉴于模型和数据的复杂性,如果由于使用TransGPT开源模型而导致任何问题,包括但不限于数据安全问题、公共舆论风险,或模型被误导、滥用、传播或不当利用所带来的任何风险和问题,我们将不承担任何责任。加入我们>
## 微信讨论群
## 协议
对本仓库源码的使用遵循开源许可协议 Apache 2.0。TransGPT支持商用。如果将TransGPT模型或其衍生品用作商业用途,请您按照如下方式联系许可方,需邮件申请并获得官方商用许可后,即可以免费商用:联系邮箱。