awesomemultimodel
【AIGC 实战入门笔记 —— AIGC 摩天大楼】分享 大语言模型(LLMs),大模型高效微调(SFT),检索增强生成(RAG),智能体(Agent),PPT自动生成, 角色扮演,文生图(Stable Diffusion) ,图像文字识别(OCR),语音识别(ASR),语音合成(TTS),人像分割(SA),多模态(VLM),Ai 换脸(Face Swapping), 文生视频(VD),图生视频(SVD),Ai 动作迁移,Ai 虚拟试衣,数字人,全模态理解(Omni),Ai音乐生成 干货学习 等 实战与经验。
https://github.com/km1994/awesomemultimodel
Last synced: about 21 hours ago
JSON representation
-
第一层 LLMs 入门篇
-
DeepSeek 系列
- 第一层 LLMs之DeepSeek-R1 复现:使用 open-r1 基于 gsm8k 数据集复现DeepSeek R1
- 如何使用 open-r1 基于 gsm8k 数据集复现DeepSeek R1 代码讲解
- 如何使用 蒸馏 DeepSeek-R1-Distill-Qwen-14B(一)
- 如何使用蒸馏 DeepSeek-R1-Distill-Qwen-14B (二)
- 如何利用 swift 蒸馏 中文DeepSeek-R1 小模型
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——DeepSeek R1初体验
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——如何使用 Ollama 在本地运行 DeepSeek R1?
- AiGC摩天大楼 —— DeepSeek R1系列——如何使用 Ollama和DeepSeek R1搭建RAG系统?
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——QWen2.5 基础模型 GRPO 训练 复现Deepseek-R1
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——KTransformers 实战篇—单卡RTX4090部署R1满血版
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:Logic-RL
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:TinyZero
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——DeepSeek R1初体验
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——如何使用 Ollama 在本地运行 DeepSeek R1?
- AiGC摩天大楼 —— DeepSeek R1系列——如何使用 Ollama和DeepSeek R1搭建RAG系统?
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——QWen2.5 基础模型 GRPO 训练 复现Deepseek-R1
- 第一层 LLMs之DeepSeek-R1 复现:使用 open-r1 基于 gsm8k 数据集复现DeepSeek R1
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——KTransformers 实战篇—单卡RTX4090部署R1满血版
- AiGC摩天大楼 —— 第一层 LLMs 之 DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:TinyZero
- AiGC摩天大楼 —— DeepSeek R1系列——LLMs 之 DeepSeek-R1 复现:Open R1
- 如何使用 open-r1 基于 gsm8k 数据集复现DeepSeek R1 代码讲解
- 如何使用 蒸馏 DeepSeek-R1-Distill-Qwen-14B(一)
- 如何使用蒸馏 DeepSeek-R1-Distill-Qwen-14B (二)
- 如何利用 swift 蒸馏 中文DeepSeek-R1 小模型
-
Simple test-time scaling 系列
-
第一阶 阿里系列
-
第七届 Kimi 系列
-
第八届 Gemma 系列
-
第六届 Phi 系列
-
第二阶 Llama 系列
-
第三阶 GLM 系列
-
第五届 Mistral 系列
-
第四阶 Baichuan 系列
-
-
第三层 LLMs 应用实战篇
-
第三层 第二阶 LLMs Agent 实战系列
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Agent千机变
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 AI Agent Application 篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Agent 设计模式篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Agent千机变
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 AI Agent Application 篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Agent 设计模式篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Single Agent vs Multi-Agent 篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Single Agent vs Multi-Agent 篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 PLANNING 规划篇
- 第三层 LLMs Agent 实战 之 OpenManus 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 AgentScope 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 AgentScope Multi-Agent 实战经验 之 狼人杀游戏 篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Qwen-Agent 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Qwen-Agent 多代理实战 五子棋群聊 篇
- 第三层 LLMs Agent 实战 之 LangGraph 实战经验篇
- 第三层 LLMs Agent 实战 之 Swarm 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 PLANNING 规划篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Memory 记忆存储篇
- 第三层 LLMs Agent 实战 之 OpenManus 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 AgentScope 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 AgentScope Multi-Agent 实战经验 之 狼人杀游戏 篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Qwen-Agent 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Qwen-Agent 多代理实战 五子棋群聊 篇
- 第三层 LLMs Agent 实战 之 LangGraph 实战经验篇
- 第三层 LLMs Agent 实战 之 Swarm 实战经验篇
- 第三层 LLMs Agent 实战 之llamaindex实战-Agent-让Agent调用多个工具函数
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Autogen 实战经验篇
- 第三层 LLMs Agent 实战 之llamaindex实战-Agent-让Agent调用多个工具函数
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Autogen 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Xagent 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Xagent 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 MetaGPT 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 AgentVerse 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 AgentVerse 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Agents 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Agents 实战经验篇
- AiGC摩天大楼 —— 第三层 LLMs Agent 实战 之 Qwen-Agent 实战经验篇
-
第三层 第一阶 LLMs RAG实战系列
-
第三层 第三阶 LLMs PPT自动生成实战系列
-
第三层 第四阶 LLM 会议纪要总结系列
-
第三层 第五阶 LLM 对齐角色扮演系列
-
第三层 第六阶 Text-to-SQL 系列
-
第三层 第七阶 长文本摘要生成 系列
-
-
第二层 LLMs 指令微调篇
-
第五届 Mistral 系列
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 LM合成LLM训练数据方法汇总
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 QA 问答对批量生成篇
- 大模型强化学习训练神器 TRL - Transformer Reinforcement Learning 篇
- ms-swift 学习(一) —— 微调篇
- ms-swift 学习(二) —— 多卡微调篇
- ms-swift 学习(三) —— 预训练篇
- ms-swift 学习(四) —— RLHF dpo 训练篇
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 LM合成LLM训练数据方法汇总
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 QA 问答对批量生成篇
- 大模型强化学习训练神器 TRL - Transformer Reinforcement Learning 篇
- ms-swift 学习(一) —— 微调篇
- ms-swift 学习(二) —— 多卡微调篇
- ms-swift 学习(三) —— 预训练篇
- ms-swift 学习(四) —— RLHF dpo 训练篇
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 Firefly 进行大模型微调
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 Qwen2 微调
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 Firefly 进行大模型微调
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 Qwen2 微调
- [AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 Qwen2 微调(使用 LLaMA-Factory)
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 ChatGLM3 模型微调学习与实战
- [AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 Qwen2 微调(使用 LLaMA-Factory)
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 ChatGLM3 模型微调学习与实战
- AiGC摩天大楼 —— 第二层 LLMs 指令微调 之 Baichuan2 学习与实战
- AiGC摩天大楼 —— 第二层 LLMs 之 DeepSeek-llm-7B-Chat LoRA 微调
- 大模型强化学习训练神器 TRL - Transformer Reinforcement Learning 篇
-
-
第六层 Stable Diffusion 文生图 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第二阶 Stable Diffusion 系列
- 【Ai绘图】Stable Diffusion教程(5)磨刀不误砍柴工!使用XYZ表格快速了解你手头的模型到底好不好用
- 【Ai绘图】Stable diffusion 汉化 指南
- 【Ai绘图】入门篇:手把手教你用 stable diffusion 绘制真人图像
- 【Ai绘图】STABLE DIFFUSION WEBUI入门教程
- 【Ai绘图】Stable Diffusion 教程(2)基础篇 如何写出好的prompt,一些技巧和原则
- 【Ai绘图】Stable Diffusion 教程(3)基础篇 -SDWEBUI的基础功能,你都会用了吗?
- 【Ai绘图】入门篇:手把手教你用 stable diffusion 绘制真人图像
- 【Ai绘图】Stable Diffusion 教程(2)基础篇 如何写出好的prompt,一些技巧和原则
- 【Ai绘图】Stable Diffusion 教程(4)基础篇 -1秒都不浪费!采样方法和步数的最优选择
- 【Ai绘图】Stable Diffusion教程(5)磨刀不误砍柴工!使用XYZ表格快速了解你手头的模型到底好不好用
- 【Ai绘图】SD教程进阶篇(6)实战:LORA模型训练叠加controlnet,COSPLAYER都担忧要失业了
- 【Ai绘图】进阶篇(7):图为什么没别人好看?因为你不会高清放大!
- 【Ai绘图】Stable diffusion 汉化 指南
- 【Ai绘图】SD教程进阶篇(6)实战:LORA模型训练叠加controlnet,COSPLAYER都担忧要失业了
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
-
第四层 LLMs 推理优化篇 第四阶 Medusa 系列
-
第六层 Stable Diffusion 文生图 篇 —— 第五阶 Stable Diffusion3.5 系列
-
第六层 Stable Diffusion 文生图 篇 —— 第四阶 PixArt 系列
-
第六层 Stable Diffusion 文生图 篇 —— 第三阶 VisCPM 系列
-
-
第四层 LLMs 推理优化篇
-
第四层 LLMs 推理优化篇 第一阶 vLLM 系列
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(一)——PageAttention 算法篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(一)——PageAttention 算法篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(二)——架构概览篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(三)——vLLM 安装部署篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(二)——架构概览篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(三)——vLLM 安装部署篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(四)——vLLM 源码学习篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(五)——vLLM 源码学习篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(四)——vLLM 源码学习篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(五)——vLLM 源码学习篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 vLLM 入门(四)——vLLM 源码学习篇
-
第四层 LLMs 推理优化篇 第二阶 Ollama 系列
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 Ollama Linux 安装篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 Ollama篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 Ollama Linux 安装篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 Ollama篇
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 Ollama下LLM服务的三种使用方式:post、langchain、lamaindex
- AiGC摩天大楼 —— 第四层 LLMs 推理优化 之 Ollama下LLM服务的三种使用方式:post、langchain、lamaindex
-
第四层 LLMs 推理优化篇 第三阶 TensorRT-LLM 系列
-
第四层 LLMs 推理优化篇 第四阶 Medusa 系列
-
-
第五层 LLM API性能评估 篇
-
第四层 LLMs 推理优化篇 第四阶 Medusa 系列
-
-
第十一层 Language-Image 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
- AiGC摩天大楼——第十一层 Language-Image篇 第六阶 之 Video-LLaVA 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第五阶 之 VisualGLM-6B 模型学习与实战
- AiGC摩天大楼——第十一层 Language-Image篇 第九阶 之GLM4V 对话模型微调篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十阶 之 CogVLM2 微调篇
- AiGC摩天大楼——第十一层 Language-Image篇 第九阶 之GLM4V 篇
- AiGC摩天大楼——第十一层MLLM篇 Qwen2.5-VL-32B 实战
- AiGC摩天大楼——第十一层MLLM篇 SmolVLM2: 让视频理解能力触手可及
- AiGC摩天大楼——第十一层MLLM篇 Qwen2.5-VL-32B 实战
- AiGC摩天大楼——第十一层MLLM篇 SmolVLM2: 让视频理解能力触手可及
- AiGC摩天大楼——第十一层MLLM篇 SmolVLM:Hugging Face推出的轻量级视觉语言模型
- AiGC摩天大楼——第十一层MLLM篇 Phi-4系列:多模态与文本处理的创新突破
- AiGC摩天大楼——第十一层MLLM篇 SmolVLM:Hugging Face推出的轻量级视觉语言模型
- AiGC摩天大楼——第十一层MLLM篇 Phi-4系列:多模态与文本处理的创新突破
- 第十一层 MLLM 篇 之 R1-Onevision
- 第十一层 MLLM 篇 之 R1-Onevision
- AiGC摩天大楼——第十一层 MLLM 篇 第十八阶 之 Qwen2.5-VL
- AiGC摩天大楼——第十一层 MLLM 篇 第十八阶 之 Qwen2.5-VL
- AiGC摩天大楼——第十一层 MLLM 篇 第十七阶 之 Janus-Pro
- AiGC摩天大楼——第十一层MLLM 之 Valley2:基于电商场景的多模态大模型
- AiGC摩天大楼——第十一层MLLM篇之VideoCLIP-XL:一种新的视频 CLIP 模型
- AiGC摩天大楼——第十一层 Language-Image篇 第十四阶 之 InternVL2 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十三阶 之 MiniCPM-V 2.6 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十二阶 之 Qwen2-VL 篇
- AiGC摩天大楼——第十一层 MLLM 篇 第十七阶 之 Janus-Pro
- AiGC摩天大楼——第十一层MLLM 之 Valley2:基于电商场景的多模态大模型
- AiGC摩天大楼——第十一层MLLM篇之VideoCLIP-XL:一种新的视频 CLIP 模型
- AiGC摩天大楼——第十一层 Language-Image篇 第十四阶 之 InternVL2 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十三阶 之 MiniCPM-V 2.6 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十二阶 之 Qwen2-VL 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十一阶 之 InternVL-Chat-V1.5 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十阶 之 CogVLM2 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第八阶 之 Qwen-VL 初体验篇
- AiGC摩天大楼——第十一层 Language-Image篇 第七阶 之 Ziya-Visual模型学习与实战
- AiGC摩天大楼——第十一层 Language-Image篇 第六阶 之 Video-LLaVA 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第五阶 之 VisualGLM-6B 模型学习与实战
- AiGC摩天大楼——第十一层 Language-Image篇 第四阶 之 MiniGPT-4 模型学习与实战
- AiGC摩天大楼——第十一层 Language-Image篇 第十一阶 之 InternVL-Chat-V1.5 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十阶 之 CogVLM2 篇
- AiGC摩天大楼——第十一层 Language-Image篇 第十阶 之 CogVLM2 微调篇
- AiGC摩天大楼——第十一层 Language-Image篇 第九阶 之GLM4V 对话模型微调篇
- AiGC摩天大楼——第十一层 Language-Image篇 第八阶 之 Qwen-VL 微调篇
- AiGC摩天大楼——第十一层 Language-Image篇 第三阶 之 LLaVA篇
- AiGC摩天大楼——第十一层 Language-Image篇 第二阶 之 BLIP2 模型学习与实战
- AiGC摩天大楼——第十一层 Language-Image篇 第一阶 之 BLIP 模型学习与实战
- AiGC摩天大楼——第十一层 Language-Image篇之Chinese-CLIP:多模态预训练模型解读和图文检索
- AiGC摩天大楼——第十一层 Language-Image篇 第三阶 之 LLaVA篇
- AiGC摩天大楼——第十一层 Language-Image篇 第二阶 之 BLIP2 模型学习与实战
- AiGC摩天大楼——第十一层 Language-Image篇 第一阶 之 BLIP 模型学习与实战
- AiGC摩天大楼——第十一层 Language-Image篇之Chinese-CLIP:多模态预训练模型解读和图文检索
-
-
第七层 OCR 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
-
-
第九层 TTS 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
- AiGC摩天大楼——第九层 TTS 入门 篇
- AiGC摩天大楼——第九层 第九层 TTS 入门 篇 之 Spark-TTS: 基于Qwen的新一代单阶段TTS模型
- AiGC摩天大楼——第九层 TTS 入门 篇
- AiGC摩天大楼——第九层 TTS 入门 篇之MeloTTS:多语言实时文本转语音的高质量工具!无GPU也可灵活使用!
- AiGC摩天大楼——第九层 TTS 入门 篇 第八阶 之 F5-TTS 篇
- AiGC摩天大楼——第九层 TTS 入门 篇 第七阶 之 CosyVoice
- AiGC摩天大楼——第九层 TTS 入门 篇 之 CSM-1b: 驱动“超真人”虚拟助手Maya的实时语音对话模型
- AiGC摩天大楼——第九层 第九层 TTS 入门 篇 之 Spark-TTS: 基于Qwen的新一代单阶段TTS模型
- AiGC摩天大楼——第九层 TTS 入门 篇 第六阶 之 OpenVoice 篇
- AiGC摩天大楼——第九层 TTS 入门 篇之MeloTTS:多语言实时文本转语音的高质量工具!无GPU也可灵活使用!
- AiGC摩天大楼——第九层 TTS 入门 篇 第八阶 之 F5-TTS 篇
- AiGC摩天大楼——第九层 TTS 入门 篇 第七阶 之 CosyVoice
- AiGC摩天大楼——第九层 TTS 入门 篇 第六阶 之 OpenVoice 篇
- AiGC摩天大楼——第九层 TTS 入门 篇 第五阶 之 ChatTTS 实战
- AiGC摩天大楼——第九层 TTS 入门 篇 第四阶 之 KAN-TTS 实战
- AiGC摩天大楼——第九层 TTS 入门 篇 第三阶 之 PaddleSpeech 实战
- AiGC摩天大楼——第九层 TTS 入门 篇 第五阶 之 ChatTTS 实战
- AiGC摩天大楼——第九层 TTS 入门 篇 第四阶 之 KAN-TTS 实战
- AiGC摩天大楼——第九层 TTS 入门 篇 第三阶 之 PaddleSpeech 实战
- AiGC摩天大楼——第九层 TTS 入门 篇 第七阶 之 CosyVoice
-
-
第十层 人像分割 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
-
-
第十三层 Ai 文生视频 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
- AiGC摩天大楼——第十三层 Ai 文生视频 第五阶 之 FastHunyuan 篇
- AiGC摩天大楼——第十三层 Ai 文生视频 第四阶 之 Allegro 篇:最强开源文生视频模型
- AiGC摩天大楼——第十三层文生视频 之 Kolors: 基于潜在扩散的大型文本到图像生成模型
- AiGC摩天大楼——第十三层 Ai 文生视频 第六阶 之 FastHunyuan 篇
- AiGC摩天大楼——第十三层文生视频 之 Kolors: 基于潜在扩散的大型文本到图像生成模型
- AiGC摩天大楼——第十三层 Ai 文生视频 第四阶 之 Allegro 篇:最强开源文生视频模型
- AiGC摩天大楼——第十三层 Ai 文生视频 第三阶 之 VideoCrafter2 篇
- AiGC摩天大楼——第十三层 Ai 文生视频 第二阶 之 Open-Sora 篇
- AiGC摩天大楼——第十三层 Ai 文生视频 第一阶 之 Latte 篇——开源文生视频DiT
- AiGC摩天大楼——第十三层 Ai 文生视频 第三阶 之 VideoCrafter2 篇
- AiGC摩天大楼——第十三层 Ai 文生视频 第二阶 之 Open-Sora 篇
- AiGC摩天大楼——第十三层 Ai 文生视频 第一阶 之 Latte 篇——开源文生视频DiT
-
-
第十二层 Ai 换脸 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
- AiGC摩天大楼——第十二层 Ai 换脸 第六阶 之 Deep-Live-Cam实时AI换脸
- AiGC摩天大楼——第十二层 Ai 换脸 第五阶 之 SDXL-EcomID-阿里推出的单个参考图像生成定制的个性图像
- AiGC摩天大楼——第十二层 Ai 换脸 第四阶 之 FaceChain-阿里推出的人物写真和个人形象生成框架
- AiGC摩天大楼——第十二层 Ai 换脸 第三阶 之 roop 篇
- AiGC摩天大楼——第十二层 Ai 换脸 第三阶 之 roop 篇
- AiGC摩天大楼——第十二层 Ai 换脸 第二阶 之 Face-Adapter 篇 —— 让人脸编辑技术突破天花板
- AiGC摩天大楼——第十二层 Ai 换脸 第六阶 之 Deep-Live-Cam实时AI换脸
- AiGC摩天大楼——第十二层 Ai 换脸 第五阶 之 SDXL-EcomID-阿里推出的单个参考图像生成定制的个性图像
- AiGC摩天大楼——第十二层 Ai 换脸 第四阶 之 FaceChain-阿里推出的人物写真和个人形象生成框架
- AiGC摩天大楼——第十二层 Ai 换脸 第二阶 之 Face-Adapter 篇 —— 让人脸编辑技术突破天花板
- AiGC摩天大楼——第十二层 Ai 换脸 第一阶 之 FaceFusion 篇
- AiGC摩天大楼——第十二层 Ai 换脸 第一阶 之 FaceFusion 篇
-
-
第十五层 Ai 动作迁移 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
- AiGC摩天大楼——第十五层 Ai 动作迁移第五阶之 — UniAnimate篇
- AiGC摩天大楼——第十五层 Ai 动作迁移 第一阶 之 DWPose 篇 :高效全身姿态估计的两阶段蒸馏方法
- AiGC摩天大楼——第十五层 Ai 动作迁移 第二阶 之 MagicPose 篇 —— 无需微调的一致性人类舞蹈视频生成
- AiGC摩天大楼——第十五层 Ai 动作迁移 第三阶 之 AnimateAnyone:图像到视频角色动画合成的框架
- AiGC摩天大楼——第十五层 Ai 动作迁移 第一阶 之 DWPose 篇 :高效全身姿态估计的两阶段蒸馏方法
- AiGC摩天大楼——第十五层 Ai 动作迁移 第二阶 之 MagicPose 篇 —— 无需微调的一致性人类舞蹈视频生成
- AiGC摩天大楼——第十五层 Ai 动作迁移 第三阶 之 AnimateAnyone:图像到视频角色动画合成的框架
- AiGC摩天大楼——第十五层 Ai 动作迁移 第三阶 之 AnimateAnyone 实战篇
- AiGC摩天大楼——第十五层 Ai 动作迁移 第四阶 之 Champ 篇 — 只需要一个视频和一张图片,让图片人物动起来
- AiGC摩天大楼——第十五层 Ai 动作迁移第四阶之 —MusePose:用于虚拟人类生成的姿势驱动的图像到视频框架
- AiGC摩天大楼——第十五层 Ai 动作迁移 第三阶 之 AnimateAnyone 实战篇
- AiGC摩天大楼——第十五层 Ai 动作迁移第四阶之 —MusePose:用于虚拟人类生成的姿势驱动的图像到视频框架
- AiGC摩天大楼——第十五层 Ai 动作迁移第五阶之 — UniAnimate篇
- AiGC摩天大楼——第十五层 Ai 动作迁移第五阶之 — UniAnimate篇:论文解读
- AiGC摩天大楼——第十五层 Ai 动作迁移第六阶之 — MimicMotion 篇 论文翻译
- AiGC摩天大楼——第十五层 Ai 动作迁移第六阶之 — MimicMotion 实战
- AiGC摩天大楼——第十五层 Ai 动作迁移第七阶之 —RealisDance篇 论文翻译
- AiGC摩天大楼——第十五层 Ai 动作迁移第八阶之 — StableAnimator篇
- AiGC摩天大楼——第十五层 Ai 动作迁移第六阶之 — MimicMotion 篇 论文翻译
- AiGC摩天大楼——第十五层 Ai 动作迁移第六阶之 — MimicMotion 实战
- AiGC摩天大楼——第十五层 Ai 动作迁移第七阶之 —RealisDance篇 论文翻译
- AiGC摩天大楼——第十五层 Ai 动作迁移第八阶之 — StableAnimator篇
-
-
第十四层 Ai 图生视频 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
- AiGC摩天大楼——第十四层 Ai 图生视频 第十四层 Ai 图生视频 之 HunyuanVideo-I2V
- AiGC摩天大楼——第十四层 Ai 图生视频 第四阶 之 Ruyi:图森未来推出的图生视频大模型
- AiGC摩天大楼——第十四层 Ai 图生视频 第十四层 Ai 图生视频 之 HunyuanVideo-I2V
- AiGC摩天大楼——第十四层 Ai 图生视频 第四阶 之 Ruyi:图森未来推出的图生视频大模型
- AiGC摩天大楼——第十四层 Ai 图生视频 第三阶 之 MOFA-Video,让静态图片“活”起来!
- AiGC摩天大楼——第十四层 Ai 图生视频 第三阶 之 MOFA-Video,让静态图片“活”起来!
- AiGC摩天大楼——第十四层 Ai 图生视频 第二阶 之 DynamiCrafter 篇——将静态图像转换为动画视频
- AiGC摩天大楼——第十四层 Ai 图生视频 第一阶 之 SV3D 篇
- AiGC摩天大楼——第十四层 Ai 图生视频 第二阶 之 DynamiCrafter 篇——将静态图像转换为动画视频
- AiGC摩天大楼——第十四层 Ai 图生视频 第一阶 之 SV3D 篇
-
-
第十七层 数字人 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
- AiGC摩天大楼第十七层数字人—Hallo2 篇
- AiGC摩天大楼——第十七层 数字人——TANGO:声音驱动视频生成全身数字人
- AiGC摩天大楼——第十七层 数字人—— EchoMimic:让数字人说话更自然,表情更生动
- AiGC摩天大楼——第十七层 数字人——V-Express 篇
- AiGC摩天大楼——第十七层 数字人—— wav2lip 篇
- AiGC摩天大楼第十七层数字人—JoyHallo:京东开源的普通话数字人项目,从效果看唇形表达流畅自然
- AiGC摩天大楼第十七层数字人—LivePortrait:高级AI肖像动画,配有拼接和重定向功能
- AiGC摩天大楼第十七层数字人—JoyHallo:京东开源的普通话数字人项目,从效果看唇形表达流畅自然
- AiGC摩天大楼第十七层数字人—LivePortrait:高级AI肖像动画,配有拼接和重定向功能
- AiGC摩天大楼第十七层数字人—Hallo2 篇
- AiGC摩天大楼——第十七层 数字人——TANGO:声音驱动视频生成全身数字人
- AiGC摩天大楼——第十七层 数字人—— EchoMimic:让数字人说话更自然,表情更生动
- AiGC摩天大楼——第十七层 数字人—— wav2lip 篇
-
-
第十六层 Ai 虚拟试衣 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
-
-
第十八层 全模态理解 篇
-
第十八层 Ai音乐生成 篇
-
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
-
Programming Languages
Categories
第三层 LLMs 应用实战篇
61
第一层 LLMs 入门篇
52
第十一层 Language-Image 篇
49
第六层 Stable Diffusion 文生图 篇
32
第二层 LLMs 指令微调篇
25
第四层 LLMs 推理优化篇
24
第十五层 Ai 动作迁移 篇
22
第九层 TTS 篇
20
第十七层 数字人 篇
13
第十三层 Ai 文生视频 篇
12
第十二层 Ai 换脸 篇
12
第十四层 Ai 图生视频 篇
10
第七层 OCR 篇
6
第十八层 全模态理解 篇
5
第十六层 Ai 虚拟试衣 篇
4
第十层 人像分割 篇
4
第十八层 Ai音乐生成 篇
4
第五层 LLM API性能评估 篇
2
Sub Categories
第六层 Stable Diffusion 文生图 篇 —— 第一阶 Midjourney 系列
165
第三层 第二阶 LLMs Agent 实战系列
37
第五届 Mistral 系列
27
DeepSeek 系列
24
第六层 Stable Diffusion 文生图 篇 —— 第二阶 Stable Diffusion 系列
14
第四层 LLMs 推理优化篇 第四阶 Medusa 系列
11
第四层 LLMs 推理优化篇 第一阶 vLLM 系列
11
第一阶 阿里系列
6
第二阶 Llama 系列
6
第四层 LLMs 推理优化篇 第二阶 Ollama 系列
6
第三层 第三阶 LLMs PPT自动生成实战系列
6
第三层 第六阶 Text-to-SQL 系列
5
第三层 第一阶 LLMs RAG实战系列
5
Simple test-time scaling 系列
4
第四层 LLMs 推理优化篇 第三阶 TensorRT-LLM 系列
4
第三层 第五阶 LLM 对齐角色扮演系列
4
第三阶 GLM 系列
4
第六层 Stable Diffusion 文生图 篇 —— 第四阶 PixArt 系列
4
第三层 第七阶 长文本摘要生成 系列
2
第六层 Stable Diffusion 文生图 篇 —— 第三阶 VisCPM 系列
2
第六届 Phi 系列
2
第三层 第四阶 LLM 会议纪要总结系列
2
第六层 Stable Diffusion 文生图 篇 —— 第五阶 Stable Diffusion3.5 系列
2
第七届 Kimi 系列
2
第四阶 Baichuan 系列
1
第八届 Gemma 系列
1