Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/fluid-cloudnative/fluid
Fluid, elastic data abstraction and acceleration for BigData/AI applications in cloud. (Project under CNCF)
https://github.com/fluid-cloudnative/fluid
ai-framework alluxio big-data data-abstraction distributed-cache kubernetes
Last synced: 6 days ago
JSON representation
Fluid, elastic data abstraction and acceleration for BigData/AI applications in cloud. (Project under CNCF)
- Host: GitHub
- URL: https://github.com/fluid-cloudnative/fluid
- Owner: fluid-cloudnative
- License: apache-2.0
- Created: 2020-07-11T22:57:18.000Z (over 4 years ago)
- Default Branch: master
- Last Pushed: 2024-04-17T16:31:36.000Z (8 months ago)
- Last Synced: 2024-04-17T18:09:55.491Z (8 months ago)
- Topics: ai-framework, alluxio, big-data, data-abstraction, distributed-cache, kubernetes
- Language: Go
- Homepage: https://fluid-cloudnative.github.io/
- Size: 41.6 MB
- Stars: 1,524
- Watchers: 31
- Forks: 805
- Open Issues: 305
-
Metadata Files:
- Readme: README-zh_CN.md
- Changelog: CHANGELOG.md
- Contributing: CONTRIBUTING.md
- License: LICENSE
- Code of conduct: CODE_OF_CONDUCT.md
- Security: SECURITY.md
- Governance: GOVERNANCE.md
- Roadmap: ROADMAP.md
Awesome Lists containing this project
README
[![License](https://img.shields.io/badge/License-Apache%202.0-blue.svg)](https://opensource.org/licenses/Apache-2.0)
[![CircleCI](https://circleci.com/gh/fluid-cloudnative/fluid.svg?style=svg)](https://circleci.com/gh/fluid-cloudnative/fluid)
[![Build Status](https://travis-ci.org/fluid-cloudnative/fluid.svg?branch=master)](https://travis-ci.org/fluid-cloudnative/fluid)
[![codecov](https://codecov.io/gh/fluid-cloudnative/fluid/branch/master/graph/badge.svg)](https://codecov.io/gh/fluid-cloudnative/fluid)
[![Go Report Card](https://goreportcard.com/badge/github.com/fluid-cloudnative/fluid)](https://goreportcard.com/report/github.com/fluid-cloudnative/fluid)
[![Artifact HUB](https://img.shields.io/endpoint?url=https://artifacthub.io/badge/repository/fluid)](https://artifacthub.io/packages/helm/fluid/fluid)
[![OpenSSF Scorecard](https://api.securityscorecards.dev/projects/github.com/fluid-cloudnative/fluid/badge)](https://scorecard.dev/viewer/?uri=github.com/fluid-cloudnative/fluid)
[![CII Best Practices](https://bestpractices.coreinfrastructure.org/projects/4886/badge)](https://bestpractices.coreinfrastructure.org/projects/4886)
[![Leaderboard](https://img.shields.io/badge/Fluid-%E6%9F%A5%E7%9C%8B%E8%B4%A1%E7%8C%AE%E6%8E%92%E8%A1%8C%E6%A6%9C-orange)](https://opensource.alibaba.com/contribution_leaderboard/details?projectValue=fluid)# Fluid
[English](./README.md) | 简体中文
|![更新](static/bell-outline-badge.svg) 最新进展:|
|------------------|
|**最新版发布**:2024年4月17日, Fluid v1.0.0 发布! 版本更新介绍详情情参见 [CHANGELOG](CHANGELOG.md)。|
|v0.9.0版发布:2023年5月26日, Fluid v0.9.0 发布! 版本更新介绍详情情参见 [CHANGELOG](CHANGELOG.md)。|
|v0.8.0版发布:2022年9月3日, Fluid v0.8.0 发布! 版本更新介绍详情情参见 [CHANGELOG](CHANGELOG.md)。|
|v0.7.0版发布:2022年3月2日, Fluid v0.7.0 发布! 版本更新介绍详情情参见 [CHANGELOG](CHANGELOG.md)。|
|v0.6.0版发布:2021年8月11日, Fluid v0.6.0 发布! 版本更新介绍详情情参见 [CHANGELOG](CHANGELOG.md)。|
|v0.5.0版发布:2021年5月16日, Fluid v0.6.0 发布! 版本更新介绍详情情参见 [CHANGELOG](CHANGELOG.md)。|
|进入CNCF:2021年4月27日, Fluid通过CNCF Technical Oversight Committee (TOC)投票决定被接受进入CNCF,成为[CNCF Sandbox Project](https://lists.cncf.io/g/cncf-toc/message/5822)。|
|v0.4.0版发布:2020年11月6日, Fluid v0.6.0 发布! 版本更新介绍详情情参见 [CHANGELOG](CHANGELOG.md)。|
|v0.3.0版发布:2020年10月1日, Fluid v0.6.0 发布! 版本更新介绍详情情参见 [CHANGELOG](CHANGELOG.md)。|## 什么是Fluid
Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用、AI应用等。
Fluid现在是[Cloud Native Computing Foundation](https://cncf.io) (CNCF) 开源基金会旗下的一个沙箱项目。关于Fluid更多的原理性介绍, 可以参见我们的论文:
1. **Rong Gu, Kai Zhang, Zhihao Xu, et al. [Fluid: Dataset Abstraction and Elastic Acceleration for Cloud-native Deep Learning Training Jobs](https://ieeexplore.ieee.org/abstract/document/9835158). IEEE ICDE, pp. 2183-2196, May, 2022. (Conference Version)**
2. **Rong Gu, Zhihao Xu, Yang Che, et al. [High-level Data Abstraction and Elastic Data Caching for Data-intensive AI Applications on Cloud-native Platforms](https://ieeexplore.ieee.org/document/10249214). IEEE TPDS, pp. 2946-2964, Vol 34(11), 2023. (Journal Version)**
通过定义数据集资源的抽象,实现如下功能:
## 核心功能
- __数据集抽象原生支持__
将数据密集型应用所需基础支撑能力功能化,实现数据高效访问并降低多维管理成本
- __可扩展的数据引擎插件__
提供统一的访问接口,方便接入第三方存储,通过不同的Runtime实现数据操作
- __自动化的数据操作__
提供多种操作模式,与自动化运维体系相结合
- __数据弹性与调度__
将数据缓存技术和弹性扩缩容、数据亲和性调度能力相结合,提高数据访问性能
- __运行时平台无关__
支持原生、边缘、Serverless Kubernetes集群、Kubernetes多集群等多样化环境,适用于混合云场景
## 重要概念
**Dataset**: 数据集是逻辑上相关的一组数据的集合,会被运算引擎使用,比如大数据的Spark,AI场景的TensorFlow。而这些数据智能的应用会创造工业界的核心价值。Dataset的管理实际上也有多个维度,比如安全性,版本管理和数据加速。我们希望从数据加速出发,对于数据集的管理提供支持。
**Runtime**: 实现数据集安全性,版本管理和数据加速等能力的执行引擎,定义了一系列生命周期的接口。可以通过实现这些接口,支持数据集的管理和加速。
## 先决条件
- Kubernetes version > 1.16, 支持CSI
- Golang 1.18+
- Helm 3## 快速开始
你可以通过 [快速开始](docs/zh/userguide/get_started.md) 在Kubernetes集群中测试Fluid.
## 文档
如果需要详细了解Fluid的使用,请参考文档 [docs](docs/README_zh.md):
- [English](docs/en/TOC.md)
- [简体中文](docs/zh/TOC.md)你也可以访问[Fluid主页](https://fluid-cloudnative.github.io)来获取有关文档.
## 快速演示
演示 1: 加速文件访问
演示 2: 加速机器学习
演示 3: 加速PVC
演示 4: 数据预热
演示 5: 在线不停机数据集缓存扩缩容
## 如何贡献
欢迎您的贡献,如何贡献请参考[CONTRIBUTING.md](CONTRIBUTING.md).
## 欢迎加入与反馈
Fluid让Kubernetes真正具有分布式数据缓存的基础能力,开源只是一个起点,需要大家的共同参与。大家在使用过程发现Bug或需要的Feature,都可以直接在 [GitHub](https://github.com/fluid-cloudnative/fluid)上面提 issue 或 PR,一起参与讨论。另外我们有一个钉钉群,欢迎您的参与和讨论。
钉钉讨论群
Slack 讨论群
- 加入 [`CNCF Slack`](https://slack.cncf.io/) 通过搜索频道 ``#fluid`` 和我们进行讨论.## 开源协议
Fluid采用Apache 2.0 license开源协议,详情参见[LICENSE](./LICENSE)文件。
## 漏洞报告
安全性是Fluid项目高度关注的事务。如果您发现或遇到安全相关的问题,欢迎您给[email protected]邮箱发送邮件报告。具体细节请查看[SECURITY.md](SECURITY.md)。
## 行为准则
Fluid 遵守 [CNCF 行为准则](https://github.com/cncf/foundation/blob/master/code-of-conduct.md)。