Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

awesome-multi-modal

The paper list in the multimodal domain.
https://github.com/zipzou/awesome-multi-modal

Last synced: 1 day ago
JSON representation

Programming Languages

Python 57 Jupyter Notebook 20

Categories

Vision LLM for Generation 72 Vision Model Backbone 54 Textual Large Language Model Backbone 51 Image Generation 41

Sub Categories

Augoregressive or MLM Paradigm in Discrete Space 21 Diffusion Paradigm 12 GAN Paradigm 8

Keywords

large-language-models 10 deep-learning 8 language-model 6 llama 6 llm 6 pretrained-models 6 vision-language-model 6 vision-language-transformer 6 gpt 6 pytorch 6 foundation-models 4 multi-modal 4 vision-transformer 4 vision-language 4 image-captioning 4 image-text-retrieval 4 multimodal 4 chatbot 4 instruction-tuning 4 chatgpt 4 semantic-segmentation 4 auto-regressive-model 4 transformers 4 object-detection 4 diffusion-models 4 image-generation 4 image-classification 4 vision-language-pretraining 2 visual-question-anwsering 2 imagenet 2 ade20k 2 vision-and-language-pre-training 2 visual-question-answering 2 visual-reasoning 2 natural-language-processing 2 flash-attention 2 chinese 2 instruction-following 2 vision-framework 2 vision-and-language 2 salesforce 2 multimodal-deep-learning 2 multimodal-datasets 2 mask-rcnn 2 deep-learning-library 2 mscoco 2 open-world-detection 2 open-world 2 representation-learning 2 swin-transformer 2