Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/Tencent/Lichee
一个多模态内容理解算法框架,其中包含数据处理、预训练模型、常见模型以及模型加速等模块。
https://github.com/Tencent/Lichee
Last synced: about 2 months ago
JSON representation
一个多模态内容理解算法框架,其中包含数据处理、预训练模型、常见模型以及模型加速等模块。
- Host: GitHub
- URL: https://github.com/Tencent/Lichee
- Owner: Tencent
- License: apache-2.0
- Created: 2021-10-18T03:15:36.000Z (about 3 years ago)
- Default Branch: main
- Last Pushed: 2021-10-26T06:31:59.000Z (about 3 years ago)
- Last Synced: 2024-11-22T18:25:22.747Z (about 2 months ago)
- Language: Python
- Size: 2.04 MB
- Stars: 307
- Watchers: 13
- Forks: 53
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- Contributing: docs/CONTRIBUTING.md
- License: LICENSE.TXT
Awesome Lists containing this project
- StarryDivineSky - Tencent/Lichee
README
## Overview
- [架构设计](docs/desc.md)
- [插件介绍](docs/plugin/README.md)
- [安装使用](docs/install.md)## 框架简介
方便使用,支持多模态,多任务的统一训练框架能力列表:
- bert + 分类任务
- 自定义任务训练(插件注册)## 框架设计
框架采用分层的思想组织模型训练流程。
- DATA 层负责读取用户数据,根据 field 管理数据。
- Parser 层负责转换原始数据为模型的输入。
- MODEL 层为模型层,具体由表示层(REPRESENTATION)和任务层(TASK)组成。
- 表示层用于抽取数据的高维特征,框架里内置了一些成熟实现(包括bert、NeXtVLAD等)。
- 任务层用于拟合具体的训练任务,框架里提供一些默认实现(包括分类任务等),用户也可以根据训练任务,自定义任务模型。
- 任务层可用于实现多任务训练。
- 框架通过配置文件组合 DATA、Parser、MODEL、Optimizer、Scheduler,构建具体的训练流程。
- 框架还内置了成熟的组件模块(Module),包括 Metrics、Loss、Layer 等,供用户选择使用。详细可[参考文档](./docs/desc.md)
## 框架安装
参考[文档](./docs/install.md)## 使用说明
```
cd examples/base_bert_cls_mac
sh train.sh
sh eval.sh
sh predict.sh
```模型训练任务被拆分为三步,每个步骤可以独立运行:
- [训练](./docs/core/train.md)
- [评估](./docs/core/eval.md)
- [预测](./docs/core/predict.md)任务执行均依赖配置文件,详细介绍可[参考文档](./docs/config)
若框架默认实现无法满足需求,也可以实现自定义插件,详细介绍可[参考文档](./docs/plugin)
## Contributing
如果你有好的意见或建议,欢迎给我们提 Issues 或 Pull Requests,为蓝鲸开源社区贡献力量。关于标准运维分支管理、Issue 以及 PR 规范,
请阅读 [Contributing Guide](docs/CONTRIBUTING.md)。