awesome-llm-projects

😎 A list of awesome projects related to LLM
https://github.com/InfiniteAICreations/awesome-llm-projects

Last synced: 17 days ago
JSON representation

Projects
- 🧠 AI Agent
  - AgentQL
  - Devon - source pair programmer
  - FinRobot - Source AI Agent Platform for Financial Applications using LLMs
  - Translation Agent
  - Devika - level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective.
  - *Devin - bench coding benchmark.
  - AgentQL
  - Aider
  - AgentGPT
  - *Devin - bench coding benchmark.
  - Plandex
  - Husky - Source Language Agent for Multi-Step Reasoning
  - DigiRL - The-Wild Device-Control Agents with Autonomous Reinforcement
  - AgentQL
  - Aider
- 👩🏽‍💻 Develop Assistant
  - CodeRabbit
  - Transformer Debugger
  - CopilotKit - app AI chatbots, in-app AI Agents, & AI-powered Textareas.
  - Tabby - hosted AI coding assistant
  - Melty - ready code.
  - GitHub Copilot - based suggestions in real time.
- 🤼 Multi-Agent Collaboration
  - ChatDev - to-use, highly customizable and extendable framework, which is based on large language models (LLMs) and serves as an ideal scenario for studying collective intelligence.
  - MetaGPT
  - TransAgents - Agent for Translating Ultra-Long Literary Texts
- 🎥 Video
  - *Emote Portrait Alive
  - AniPortrait - Driven Synthesis of Photorealistic Portrait Animations
  - MuseV - length and High Fidelity Virtual Human Video Generation with Visual Conditioned Parallel Denoising.
  - CameraCtrl - to-Video Generation.
  - OpenVoice
  - AniTalker - Decoupled Facial Motion Encoding
  - EasyAnimate - to-End Solution for High-Resolution and Long Video Generation Based on Transformer Diffusion.
  - MusePose - Driven Image-to-Video Framework for Virtual Human Generation
  - MASA
  - MimicMotion - Quality Human Motion Video Generation with Confidence-aware Pose Guidance
  - Video-Infinity - Infinity generates long videos quickly using multiple GPUs without extra training.
  - DiffSynth Studio
  - MotionClone - Free Motion Cloning for Controllable Video Generation
  - *Sora
  - Runway
  - HeyGen
  - *VASA-1 - Driven Talking Faces Generated in Real Time.
  - Veo
  - Pandora
  - V-Express - Express aims to generate a talking head video under the control of a reference image, an audio, and a sequence of V-Kps images.
  - Hedra - generated videos and video components.
  - SAM 2
- 🕸️ Search Engine
  - Perplexica - powered search engine. It is an Open source alternative to Perplexity AI
  - Reor
  - Phind
  - Devv
  - Perplexity
  - Arc
- 💻 Terminal
  - Gorilla - line interactions with a user-centric tool.
  - Open Interpreter
  - Warp - powered assistance for command lookups and allow users to input their objectives in plain English
  - CodeWhisperer Cli - style completions for hundreds of popular CLIs like as Git, npm, Docker, MongoDB Atlas, and the AWS CLI. Previously known as [fig](https://fig.io/).
- 📰 Web Sites
  - Design2Code - End Engineering
  - OpenUI
  - Dora
  - Tempo - quality react code directly in your codebase so you can ship UIs in minutes.
  - v0
- 🗜️ Hardware
  - insight
  - OpenGlass - powered smart glasses
  - LeRobot - to-end Learning for Real-World Robotics in Pytorch
  - *LOOI Root
  - Limitless
  - Frame AI glasses - source eyewear.
  - Rabbit R1
  - *Haptic Source-effector - body Haptics via Non-invasive Brain Stimulation
  - Octo - based robot policy trained on a diverse mix of 800k robot trajectories.
  - HumanPlus
  - Ray-Ban Meta Smart Glasses - Ban Meta collection combines the latest in wearable tech with authentic Ray-Ban design, to keep you connected wherever you go.
  - Solos AirGo Vision
  - Groq - time AI applications come to life today.
  - Friend - Source AI Wearable with 24h+ on single charge
- ⌨️ Prompt Engineering
  - Prompt-Engineering-Guide
  - Prompt Library
- 🤯 LLMs Inference and Serving
  - vLLM - throughput and memory-efficient inference and serving engine for LLMs.
  - Text Generation Inference
  - Ollama
  - LM Studio
- 📋 Others
  - Cradle - improvment, and skill curation, in a standardized general environment with minimal requirements.
  - LLMPerf - project/llmperf-leaderboard) for LLMs.
  - WebLINX - world website navigation with multi-turn dialogue.
  - HippoRAG - term memory that enables LLMs to continuously integrate knowledge across external documents.
  - Deep-tempest
  - Great Tables
  - ComfyUI
  - Gauth
  - Latent Box - lists for AI, creativity and art.
  - Vanna - licensed open-source Python RAG (Retrieval-Augmented Generation) framework for SQL generation and related functionality.
  - LLM Transparency Tool - TT), an open-source interactive toolkit for analyzing internal workings of Transformer-based language models.
  - LLM Visualization
  - Rewind
  - Cursor
  - Raycast
  - Gamma
- 🏆 Benchmarks Leaderboard
  - Occiglot Euro LLM Leaderboard - translated into the four main languages from the Okapi benchmark and Belebele (French, Italian, German and Spanish).
  - BigCodeBench Leaderboard
- 🌄 Image
  - Stable Diffusion - to-image model.
Projekte
- 💡Produktivität
  - Podwise - App, die KI verwendet, um wichtige Informationen aus Podcasts zu extrahieren und automatisch Transkripte, Gliederungen, Schlüsselwörter und Mindmaps für die Zuhörer zu erstellen
- 🦄 LLMs
  - Hunyuan-DiT - Resolution-Diffusion-Transformator mit feinkörnigem chinesischem Verständnis
  - GLM-4-9B - 4-Serie: Offene mehrsprachige multimodale Chat-LMs
  - AutoCoder - Generierungsaufgabe entwickelt wurde. Seine Testgenauigkeit auf dem HumanEval-Basisdatensatz übertrifft die von GPT-4 Turbo (April 2024) und GPT-4o.
  - Phi-3 Familie - 3 Familie kleiner Sprach- und multimodaler Modelle. Sprachmodelle sind in kurzen und langen Kontextlängen verfügbar.
  - Gemma 2 - Tools integrieren.
  - OpenChat - Source-Sprachmodelle mit unvollständigen Daten
  - Awesome-Chinese-LLM - Source-Chinesische LLMs.
  - llama3
  - mPLUG-DocOwl
  - WizardLM
  - Snowflake Arctic - MoE-Hybrid-Transformator-Architektur, die von Grund auf vom Snowflake AI Research Team vortrainiert wurde. Durchschnittlich werden Codierung (HumanEval+ und MBPP+), SQL-Generierung (Spider) und Anweisungsbefolgung (IFEval) verwendet.
  - Qwen 1.8B,7B,14B,72B - und vortrainiertes großes Sprachmodell, vorgeschlagen von Alibaba Cloud.
  - Granite Code Models 3b,8b,20b,34b - Source-Code-Modelle: Eine Familie von Open Foundation Models für Code Intelligence
  - Fish Speech V1.2 - to-Speech (TTS) Modell, das auf 300.000 Stunden englischer, chinesischer und japanischer Audiodaten trainiert wurde.
  - Mistral
  - Grok-1 - 1 ist ein 314 Milliarden Parameter Mixture-of-Experts Modell, das von xAI von Grund auf neu trainiert wurde.
  - DBRX
  - CodeGemma-7b - Veröffentlichung für Code-LLMs.
  - DeepSeek-V2-Chat - of-Experts Sprachmodell
  - MiniCPM-V 2.0 - und Verständnisfähigkeiten
  - Stable Audio Open 1.0 - Audio mit 44,1 kHz aus Text-Prompts.
  - Nemotron 4 340B - , Anweisungs- und Belohnungsmodelle.
  - Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, und Qwen2-72B - Team, Alibaba Cloud, entwickelt wurde.
- 💬 ChatBot
  - Claude - Assistenten von Anthropic.
  - ChatGPT - System. Verwenden Sie es für ansprechende Gespräche, gewinnen Sie Einblicke, automatisieren Sie Aufgaben und erleben Sie die Zukunft der AI, alles an einem Ort.
  - character.ai
  - Mistral AI
- 🗣️ Voice
  - *Vall-E - Sprachmodell für die Sprachsynthese.
  - ElevenLabs
  - Whisper
  - Krisp
  - Voicemod - Stimmenverzerrer und Soundboard, verfügbar sowohl auf Windows als auch auf macOS.
  - *NaturalSpeech 3 - Shot-Sprachsynthese mit faktorisierter Codec- und Diffusionsmodellen.
  - VoiceCraft - Shot-Sprachediting und Text-to-Speech in freier Wildbahn.
  - Parler-TTS - TTS ist ein leichtgewichtiges Text-to-Speech (TTS) Modell, das hochwertige, natürlich klingende Sprache im Stil eines gegebenen Sprechers (Geschlecht, Tonhöhe, Sprechstil usw.) erzeugen kann.
  - Sounds
  - VIVA - gestützte kreative visuelle Designplattform
  - ChatTTS
  - Dream Machine - Modell, das schnell hochwertige, realistische Videos aus Text und Bildern erstellt.
  - CosyVoice - , Trainings- und Bereitstellungs-Full-Stack-Fähigkeiten bietet.
  - StreamSpeech - und gleichzeitige Spracherkennung, Sprachübersetzung und Sprachsynthese.
- 🎵 Music
  - Udio
  - Jamboss - Musikgenerator-App, mit der Sie Ihre Ideen und Texte in erstaunliche vollständige Songs verwandeln können.
  - Haimian Music - generiertes Musikprodukt, das sowohl in Chinesisch als auch in Englisch eine überlegene Gesangsqualität bietet.
- 🌄 Image
  - DALL-E
  - BasicPBC
  - DesignEdit
  - ResAdapter - and-Play-Resolution-Adapter, der Diffusionsmodelle beliebiger Stil-Domänen ermöglicht, auflösungsfreie Bilder zu erzeugen: keine zusätzliche Schulung, keine zusätzliche Inferenz und kein Stiltransfer.
  - FaceChain - Learning-Toolchain zur Erstellung Ihres digitalen Zwillings.
  - APISR - World Anime Super-Resolution (CVPR 2024)
  - OMG: Occlusion-friendly Personalized Multi-concept Generation In Diffusion Models - Bilderzeugung
  - Omost
  - IMAGDressing
  - PaintsUndo
  - VAR - Style-Modelle über Diffusion hinaushebt und Skalierungsgesetze beobachtet.
  - Stable Diffusion - Learning-Text-zu-Bild-Modell.
  - Midjourney - dienst, das Bilder aus natürlichen Sprachbeschreibungen erstellt, ähnlich wie andere AI-Technologien wie OpenAIs DALL-E und Stability AIs Stable Diffusion.
  - StickerBaker - Source-Tool, das es Benutzern ermöglicht, Aufkleber mit AI-Technologie zu erstellen.
  - *PIXART-Σ - zu-Stark-Training des Diffusionstransformators für 4K-Text-zu-Bild-Generierung.
  - Ideogram - Tool, das realistische Bilder, Poster, Logos und mehr generiert.
  - MagicClothing
  - *IntrinsicAnything
  - HeyBeauty
  - IC-Light - Light ist ein Projekt zur Manipulation der Beleuchtung von Bildern.
  - Logo Diffusion
  - MistoLine - ControlNet-Modell für anpassbare Line-Art-Konditionierung
  - InstaDrag - basierte Bildbearbeitung, die aus Videos hervorgeht
  - Hallo - gestützte visuelle Synthese für die Animation von Porträtbildern
  - UniAnimate
  - Leonardo AI - Tool, mit dem Sie erstklassige visuelle Assets für Ihre Projekte erstellen können.
  - MimicBrush - Shot-Bildbearbeitung mit Referenzimitation
  - SketchDeco - Weiß-Skizzen mit Farbe.
  - LivePortrait - und Retargeting-Steuerung
  - ToonCrafter - Bilder interpolieren, indem es die vortrainierten Bild-zu-Video-Diffusionsprioren nutzt.
  - Tensor.Art - Modell-Sharing-Plattform, Online-Modelle ausführen, um Bilder zu generieren und Modelle kostenlos zu trainieren.
  - AutoStudio
  - Krea
- 🧸 3D Model
  - AIUNI
  - MeshFormer - Generierung mit 3D-geführt
  - Unique3D - Mesh-Generierung aus einem einzigen Bild.
  - *Make-It-Vivid - Charaktere aus Text.
  - PantoMatrix - und Körperanimationen
  - TripoSR - Generierungsmodell, das in Zusammenarbeit zwischen Stability AI und Tripo AI entwickelt wurde.
  - DiffTF - Diffusionsmodell mit Transformator
  - DreamMat - Materialgenerierung mit geometrie- und lichtbewussten Diffusionsmodellen
  - Era3D - Diffusion mit effizienter zeilenweiser Aufmerksamkeit.
  - *CAT3D - View-Diffusionsmodellen
  - *OccFusion
- 🏆 Benchmarks Leaderboard
  - Toolbench Leaderboard - Tool-Manipulationsfähigkeiten.
  - OpenCompass 2.0 LLM Leaderboard
  - Open Ko-LLM Leaderboard
  - LMSys Chatbot Arena Leaderboard - Plattform. Verwenden Sie Benutzerstimmen, um Elo-Bewertungen zu berechnen.
  - META Leaderboard
  - LLM-Perf Leaderboard - Benchmark und Optimum-Flavors zu benchmarken.
  - Big Code Models Leaderboard - Mehrsprachigen Code-Generierungsmodellen auf dem HumanEval-Benchmark und MultiPL-E.
  - Open ASR Leaderboard
  - open_llm_leaderboard

Programming Languages

Python 70 TypeScript 5 Jupyter Notebook 5 JavaScript 4 Go 2 C 2 HTML 2 Shell 1 MDX 1 Rust 1

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

awesome-llm-projects

Projects

🧠 AI Agent

👩🏽‍💻 Develop Assistant

🤼 Multi-Agent Collaboration

🎥 Video

🕸️ Search Engine

💻 Terminal

📰 Web Sites

🗜️ Hardware

⌨️ Prompt Engineering

🤯 LLMs Inference and Serving

📋 Others

🏆 Benchmarks Leaderboard

🌄 Image

Projekte

💡Produktivität

🦄 LLMs

💬 ChatBot

🗣️ Voice

🎵 Music

🌄 Image

🧸 3D Model

🏆 Benchmarks Leaderboard