https://github.com/opendatalab/dsdl-docs
Data Set Description Language Specification (新一代人工智能数据集描述语言DSDL)
https://github.com/opendatalab/dsdl-docs
Last synced: 6 months ago
JSON representation
Data Set Description Language Specification (新一代人工智能数据集描述语言DSDL)
- Host: GitHub
- URL: https://github.com/opendatalab/dsdl-docs
- Owner: opendatalab
- License: apache-2.0
- Created: 2022-09-07T08:48:24.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2024-05-29T03:05:39.000Z (over 1 year ago)
- Last Synced: 2025-04-10T20:07:34.006Z (9 months ago)
- Language: HTML
- Homepage: https://opendatalab.github.io/dsdl-docs/
- Size: 31 MB
- Stars: 47
- Watchers: 3
- Forks: 6
- Open Issues: 1
-
Metadata Files:
- Readme: README-zh_CN.md
- License: LICENSE
Awesome Lists containing this project
README
[English](./README.md) | 简体中文
## 简介
DSDL(Data Set Description Language)是新一代人工智能数据集描述语言, 旨在解决AI数据集格式不统一导致的使用不方便问题。最终目标是在未来做到不同任务、不同模态数据间互通互联,推动人工智能进一步发展。
语言特性
- **通用性**
该语言主要目的是提供一种统一表示的标准,可以覆盖各个领域的人工智能数据,而不是基于特定的一种任务或者某个领域设计。该语言应该可以用一致的格式来表达不同模态和结构的数据。
- **便携性**
写完无需修改,随处分发。
数据集描述可以被广泛的分发和交换,不需要修改就可以在各种环境下使用。这一目标的实现对于建立开发繁荣生态至关重要。为此我们需要仔细检查实现细节,使其对底层设施或组织无感知,从而去除基于特定假设的无必要依赖。
- **可拓展性**
在不需要修改核心标准的情况下可以拓展表述的边界。对于C++或者Python等编程语言,应用边界可以通过使用链接库或者软件包得以显著拓展,而核心语法可以在很长的时间内保持稳定。基于链接库和包,可以形成丰富的生态系统,使对应语言可以长时间保持活跃度和发展。
## 文档
[DSDL入门文档](https://opendatalab.github.io/dsdl-docs/)
## 引用
```bibtex
@misc{wang2024dsdl,
title={DSDL: Data Set Description Language for Bridging Modalities and Tasks in AI Data},
author={Bin Wang and Linke Ouyang and Fan Wu and Wenchang Ning and Xiao Han and Zhiyuan Zhao and Jiahui Peng and Yiying Jiang and Dahua Lin and Conghui He},
year={2024},
eprint={2405.18315},
archivePrefix={arXiv},
primaryClass={cs.AI}
}
```
## 开源许可证
该项目采用 [Apache 2.0 开源许可证](LICENSE)。