awesome-llm-projects
😎 A list of awesome projects related to LLM
https://github.com/InfiniteAICreations/awesome-llm-projects
Last synced: 5 days ago
JSON representation
-
Projects
-
🧠 AI Agent
- AgentQL
- Devon - source pair programmer
- FinRobot - Source AI Agent Platform for Financial Applications using LLMs
- Translation Agent
- Devika - level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective.
- *Devin - bench coding benchmark.
- AgentQL
- Aider
- AgentGPT
- *Devin - bench coding benchmark.
- Plandex
- Husky - Source Language Agent for Multi-Step Reasoning
- DigiRL - The-Wild Device-Control Agents with Autonomous Reinforcement
- AgentQL
- Aider
-
👩🏽💻 Develop Assistant
- CodeRabbit
- Transformer Debugger
- CopilotKit - app AI chatbots, in-app AI Agents, & AI-powered Textareas.
- Tabby - hosted AI coding assistant
- Melty - ready code.
- GitHub Copilot - based suggestions in real time.
-
🤼 Multi-Agent Collaboration
- ChatDev - to-use, highly customizable and extendable framework, which is based on large language models (LLMs) and serves as an ideal scenario for studying collective intelligence.
- MetaGPT
- TransAgents - Agent for Translating Ultra-Long Literary Texts
-
🎥 Video
- *Emote Portrait Alive
- AniPortrait - Driven Synthesis of Photorealistic Portrait Animations
- MuseV - length and High Fidelity Virtual Human Video Generation with Visual Conditioned Parallel Denoising.
- CameraCtrl - to-Video Generation.
- OpenVoice
- AniTalker - Decoupled Facial Motion Encoding
- EasyAnimate - to-End Solution for High-Resolution and Long Video Generation Based on Transformer Diffusion.
- MusePose - Driven Image-to-Video Framework for Virtual Human Generation
- MASA
- MimicMotion - Quality Human Motion Video Generation with Confidence-aware Pose Guidance
- Video-Infinity - Infinity generates long videos quickly using multiple GPUs without extra training.
- DiffSynth Studio
- MotionClone - Free Motion Cloning for Controllable Video Generation
- *Sora
- Runway
- HeyGen
- *VASA-1 - Driven Talking Faces Generated in Real Time.
- Veo
- Pandora
- V-Express - Express aims to generate a talking head video under the control of a reference image, an audio, and a sequence of V-Kps images.
- Hedra - generated videos and video components.
- SAM 2
-
🕸️ Search Engine
- Perplexica - powered search engine. It is an Open source alternative to Perplexity AI
- Reor
- Phind
- Devv
- Perplexity
- Arc
-
💻 Terminal
- Gorilla - line interactions with a user-centric tool.
- Open Interpreter
- Warp - powered assistance for command lookups and allow users to input their objectives in plain English
- CodeWhisperer Cli - style completions for hundreds of popular CLIs like as Git, npm, Docker, MongoDB Atlas, and the AWS CLI. Previously known as [fig](https://fig.io/).
-
📰 Web Sites
- Design2Code - End Engineering
- OpenUI
- Dora
- Tempo - quality react code directly in your codebase so you can ship UIs in minutes.
- v0
-
🗜️ Hardware
- insight
- OpenGlass - powered smart glasses
- LeRobot - to-end Learning for Real-World Robotics in Pytorch
- *LOOI Root
- Limitless
- Frame AI glasses - source eyewear.
- Rabbit R1
- *Haptic Source-effector - body Haptics via Non-invasive Brain Stimulation
- Octo - based robot policy trained on a diverse mix of 800k robot trajectories.
- HumanPlus
- Ray-Ban Meta Smart Glasses - Ban Meta collection combines the latest in wearable tech with authentic Ray-Ban design, to keep you connected wherever you go.
- Solos AirGo Vision
- Groq - time AI applications come to life today.
- Friend - Source AI Wearable with 24h+ on single charge
-
⌨️ Prompt Engineering
-
🤯 LLMs Inference and Serving
- vLLM - throughput and memory-efficient inference and serving engine for LLMs.
- Text Generation Inference
- Ollama
- LM Studio
-
📋 Others
- Cradle - improvment, and skill curation, in a standardized general environment with minimal requirements.
- LLMPerf - project/llmperf-leaderboard) for LLMs.
- WebLINX - world website navigation with multi-turn dialogue.
- HippoRAG - term memory that enables LLMs to continuously integrate knowledge across external documents.
- Deep-tempest
- Great Tables
- ComfyUI
- Gauth
- Latent Box - lists for AI, creativity and art.
- Vanna - licensed open-source Python RAG (Retrieval-Augmented Generation) framework for SQL generation and related functionality.
- LLM Transparency Tool - TT), an open-source interactive toolkit for analyzing internal workings of Transformer-based language models.
- LLM Visualization
- Rewind
- Cursor
- Raycast
- Gamma
-
🏆 Benchmarks Leaderboard
- Occiglot Euro LLM Leaderboard - translated into the four main languages from the Okapi benchmark and Belebele (French, Italian, German and Spanish).
- BigCodeBench Leaderboard
-
🌄 Image
- Stable Diffusion - to-image model.
-
-
Projekte
-
💡Produktivität
- Podwise - App, die KI verwendet, um wichtige Informationen aus Podcasts zu extrahieren und automatisch Transkripte, Gliederungen, Schlüsselwörter und Mindmaps für die Zuhörer zu erstellen
-
🦄 LLMs
- Hunyuan-DiT - Resolution-Diffusion-Transformator mit feinkörnigem chinesischem Verständnis
- GLM-4-9B - 4-Serie: Offene mehrsprachige multimodale Chat-LMs
- AutoCoder - Generierungsaufgabe entwickelt wurde. Seine Testgenauigkeit auf dem HumanEval-Basisdatensatz übertrifft die von GPT-4 Turbo (April 2024) und GPT-4o.
- Phi-3 Familie - 3 Familie kleiner Sprach- und multimodaler Modelle. Sprachmodelle sind in kurzen und langen Kontextlängen verfügbar.
- Gemma 2 - Tools integrieren.
- OpenChat - Source-Sprachmodelle mit unvollständigen Daten
- Awesome-Chinese-LLM - Source-Chinesische LLMs.
- llama3
- mPLUG-DocOwl
- WizardLM
- Snowflake Arctic - MoE-Hybrid-Transformator-Architektur, die von Grund auf vom Snowflake AI Research Team vortrainiert wurde. Durchschnittlich werden Codierung (HumanEval+ und MBPP+), SQL-Generierung (Spider) und Anweisungsbefolgung (IFEval) verwendet.
- Qwen 1.8B,7B,14B,72B - und vortrainiertes großes Sprachmodell, vorgeschlagen von Alibaba Cloud.
- Granite Code Models 3b,8b,20b,34b - Source-Code-Modelle: Eine Familie von Open Foundation Models für Code Intelligence
- Fish Speech V1.2 - to-Speech (TTS) Modell, das auf 300.000 Stunden englischer, chinesischer und japanischer Audiodaten trainiert wurde.
- Mistral
- Grok-1 - 1 ist ein 314 Milliarden Parameter Mixture-of-Experts Modell, das von xAI von Grund auf neu trainiert wurde.
- DBRX
- CodeGemma-7b - Veröffentlichung für Code-LLMs.
- DeepSeek-V2-Chat - of-Experts Sprachmodell
- MiniCPM-V 2.0 - und Verständnisfähigkeiten
- Stable Audio Open 1.0 - Audio mit 44,1 kHz aus Text-Prompts.
- Nemotron 4 340B - , Anweisungs- und Belohnungsmodelle.
- Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, und Qwen2-72B - Team, Alibaba Cloud, entwickelt wurde.
-
💬 ChatBot
- Claude - Assistenten von Anthropic.
- ChatGPT - System. Verwenden Sie es für ansprechende Gespräche, gewinnen Sie Einblicke, automatisieren Sie Aufgaben und erleben Sie die Zukunft der AI, alles an einem Ort.
- character.ai
- Mistral AI
-
🗣️ Voice
- *Vall-E - Sprachmodell für die Sprachsynthese.
- ElevenLabs
- Whisper
- Krisp
- Voicemod - Stimmenverzerrer und Soundboard, verfügbar sowohl auf Windows als auch auf macOS.
- *NaturalSpeech 3 - Shot-Sprachsynthese mit faktorisierter Codec- und Diffusionsmodellen.
- VoiceCraft - Shot-Sprachediting und Text-to-Speech in freier Wildbahn.
- Parler-TTS - TTS ist ein leichtgewichtiges Text-to-Speech (TTS) Modell, das hochwertige, natürlich klingende Sprache im Stil eines gegebenen Sprechers (Geschlecht, Tonhöhe, Sprechstil usw.) erzeugen kann.
- Sounds
- VIVA - gestützte kreative visuelle Designplattform
- ChatTTS
- Dream Machine - Modell, das schnell hochwertige, realistische Videos aus Text und Bildern erstellt.
- CosyVoice - , Trainings- und Bereitstellungs-Full-Stack-Fähigkeiten bietet.
- StreamSpeech - und gleichzeitige Spracherkennung, Sprachübersetzung und Sprachsynthese.
-
🎵 Music
- Udio
- Jamboss - Musikgenerator-App, mit der Sie Ihre Ideen und Texte in erstaunliche vollständige Songs verwandeln können.
- Haimian Music - generiertes Musikprodukt, das sowohl in Chinesisch als auch in Englisch eine überlegene Gesangsqualität bietet.
-
🌄 Image
- DALL-E
- BasicPBC
- DesignEdit
- ResAdapter - and-Play-Resolution-Adapter, der Diffusionsmodelle beliebiger Stil-Domänen ermöglicht, auflösungsfreie Bilder zu erzeugen: keine zusätzliche Schulung, keine zusätzliche Inferenz und kein Stiltransfer.
- FaceChain - Learning-Toolchain zur Erstellung Ihres digitalen Zwillings.
- APISR - World Anime Super-Resolution (CVPR 2024)
- OMG: Occlusion-friendly Personalized Multi-concept Generation In Diffusion Models - Bilderzeugung
- Omost
- IMAGDressing
- PaintsUndo
- VAR - Style-Modelle über Diffusion hinaushebt und Skalierungsgesetze beobachtet.
- Stable Diffusion - Learning-Text-zu-Bild-Modell.
- Midjourney - dienst, das Bilder aus natürlichen Sprachbeschreibungen erstellt, ähnlich wie andere AI-Technologien wie OpenAIs DALL-E und Stability AIs Stable Diffusion.
- StickerBaker - Source-Tool, das es Benutzern ermöglicht, Aufkleber mit AI-Technologie zu erstellen.
- *PIXART-Σ - zu-Stark-Training des Diffusionstransformators für 4K-Text-zu-Bild-Generierung.
- Ideogram - Tool, das realistische Bilder, Poster, Logos und mehr generiert.
- MagicClothing
- *IntrinsicAnything
- HeyBeauty
- IC-Light - Light ist ein Projekt zur Manipulation der Beleuchtung von Bildern.
- Logo Diffusion
- MistoLine - ControlNet-Modell für anpassbare Line-Art-Konditionierung
- InstaDrag - basierte Bildbearbeitung, die aus Videos hervorgeht
- Hallo - gestützte visuelle Synthese für die Animation von Porträtbildern
- UniAnimate
- Leonardo AI - Tool, mit dem Sie erstklassige visuelle Assets für Ihre Projekte erstellen können.
- MimicBrush - Shot-Bildbearbeitung mit Referenzimitation
- SketchDeco - Weiß-Skizzen mit Farbe.
- LivePortrait - und Retargeting-Steuerung
- ToonCrafter - Bilder interpolieren, indem es die vortrainierten Bild-zu-Video-Diffusionsprioren nutzt.
- Tensor.Art - Modell-Sharing-Plattform, Online-Modelle ausführen, um Bilder zu generieren und Modelle kostenlos zu trainieren.
- AutoStudio
- Krea
-
🧸 3D Model
- AIUNI
- MeshFormer - Generierung mit 3D-geführt
- Unique3D - Mesh-Generierung aus einem einzigen Bild.
- *Make-It-Vivid - Charaktere aus Text.
- PantoMatrix - und Körperanimationen
- TripoSR - Generierungsmodell, das in Zusammenarbeit zwischen Stability AI und Tripo AI entwickelt wurde.
- DiffTF - Diffusionsmodell mit Transformator
- DreamMat - Materialgenerierung mit geometrie- und lichtbewussten Diffusionsmodellen
- Era3D - Diffusion mit effizienter zeilenweiser Aufmerksamkeit.
- *CAT3D - View-Diffusionsmodellen
- *OccFusion
-
🏆 Benchmarks Leaderboard
- Toolbench Leaderboard - Tool-Manipulationsfähigkeiten.
- OpenCompass 2.0 LLM Leaderboard
- Open Ko-LLM Leaderboard
- LMSys Chatbot Arena Leaderboard - Plattform. Verwenden Sie Benutzerstimmen, um Elo-Bewertungen zu berechnen.
- META Leaderboard
- LLM-Perf Leaderboard - Benchmark und Optimum-Flavors zu benchmarken.
- Big Code Models Leaderboard - Mehrsprachigen Code-Generierungsmodellen auf dem HumanEval-Benchmark und MultiPL-E.
- Open ASR Leaderboard
- open_llm_leaderboard
-
Programming Languages
Categories
Sub Categories
🌄 Image
34
🦄 LLMs
23
🎥 Video
22
📋 Others
16
🧠 AI Agent
15
🗜️ Hardware
14
🗣️ Voice
14
🧸 3D Model
11
🏆 Benchmarks Leaderboard
11
🕸️ Search Engine
6
👩🏽💻 Develop Assistant
6
📰 Web Sites
5
🤯 LLMs Inference and Serving
4
💬 ChatBot
4
💻 Terminal
4
🎵 Music
3
🤼 Multi-Agent Collaboration
3
⌨️ Prompt Engineering
2
💡Produktivität
1
Keywords
llm
13
ai
9
chatgpt
6
agent
6
gpt-4
5
gpt
5
chinese
4
gpt-4o
4
text-to-speech
4
tts
4
cli
4
large-language-models
4
nlp
4
llama
4
python
4
video-generation
4
pytorch
4
openai
4
developer-tools
3
ollama
3
command-line
3
diffusion-models
3
generative-ai
3
deep-learning
3
deepseek
2
inference
2
art
2
opus
2
gpt-35-turbo
2
qwen
2
gpt-3
2
claude-3
2
aigc
2
transformer
2
terminal
2
rag
2
stable-diffusion
2
agents
2
golang
2
ai-agent
2
llama3
2
multimodal
2
try-on
2
text-to-image-generation
2
llms
2
chatglm
2
code-generation
2
image-animation
2
face-animation
2
english
2