awesome-distributed-ml

A curated list of awesome projects and papers for distributed training or inference
https://github.com/Shenggan/awesome-distributed-ml

Last synced: about 11 hours ago
JSON representation

Programming Languages

Categories

Papers 81 Open Source Projects 13 Contribute 1

Sub Categories

Auto Parallelization 10 Pipeline Parallelism 9 Inference and Serving 9 Mixture-of-Experts System 8 Tensor Movement 8 Communication Optimization 7 Applications 6 Memory Efficient Training 6 Hybrid Parallelism & Framework 5 Sequence Parallelism 5 Survey 3 Fault-tolerant Training 3 Graph Neural Networks System 3

Keywords

deep-learning 4 machine-learning 4 distributed-computing 3 distributed-training 3 high-performance-computing 3 large-language-models 2 distributed-systems 2 auto-parallelization 2 compiler 2 llm 2 rhino 1 disthlo 1 pipeline-parallelism 1 model-parallelism 1 memory-efficient 1 gpu 1 data-parallelism 1 jax 1 alpa 1 transformers 1 model-para 1 pytorch 1 llm-training 1 python 1 neural-network 1 nerlnet 1 ml 1 iot 1 federated-learning-framework 1 federated-learning 1 federated 1 fault-tolerance 1 erlang 1 distributed-ml 1 distributed-machine-learning 1 cowboy 1 artificial-intelligence-projects 1 ai 1 llama 1 graph-neural-networks 1 diffusion-models 1 automatic-parallelization 1