https://github.com/toki-plus/ai-video-workflow
全自动AI原生视频生成工作流,集成文生图(LibLib)/图生视频(即梦)/文生音乐(即梦)和AI提示词生成(豆包),一键创作AIGC短视频。generative-ai, text-to-video, image-to-video, text-to-music, aigc, automation, pyqt5.
https://github.com/toki-plus/ai-video-workflow
ai-content-creation aigc automation bot content-creation ffmpeg llm pyqt5 python short-video tiktok video-processing
Last synced: about 2 months ago
JSON representation
全自动AI原生视频生成工作流,集成文生图(LibLib)/图生视频(即梦)/文生音乐(即梦)和AI提示词生成(豆包),一键创作AIGC短视频。generative-ai, text-to-video, image-to-video, text-to-music, aigc, automation, pyqt5.
- Host: GitHub
- URL: https://github.com/toki-plus/ai-video-workflow
- Owner: toki-plus
- License: mit
- Created: 2025-12-10T18:52:50.000Z (6 months ago)
- Default Branch: main
- Last Pushed: 2026-01-12T09:57:02.000Z (5 months ago)
- Last Synced: 2026-01-12T18:48:23.334Z (5 months ago)
- Topics: ai-content-creation, aigc, automation, bot, content-creation, ffmpeg, llm, pyqt5, python, short-video, tiktok, video-processing
- Language: Python
- Homepage:
- Size: 10.3 MB
- Stars: 12
- Watchers: 0
- Forks: 5
- Open Issues: 1
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# AI Video Workflow: 全自动 AI 原生视频生成工作流
[简体中文](./README.md) | [English](./README_en.md)
[](https://github.com/toki-plus/ai-video-workflow/stargazers)
[](https://github.com/toki-plus/ai-video-workflow/network/members)
[](https://choosealicense.com/licenses/mit/)
[](https://github.com/toki-plus/ai-video-workflow/pulls)
**`AI Video Workflow` 是一款免费、开源的桌面应用程序,它将多个顶尖的AI模型(文生图、图生视频、文生音乐)串联成一个全自动的AI原生视频创作流水线。**
你是否想创作引人注目的AI短视频,却被繁琐的平台切换、复杂的参数调整和枯竭的创作灵感所困扰?本项目旨在将AI视频创作的整个过程简化为几次点击,让任何人都能轻松生成具有独特视觉风格和定制化配乐的短视频。
---
## ✨ 核心功能
这不仅是一个工具,更是一个完整的 AIGC 创作生态系统:
- **🤖 全自动AI创作流水线**:
- **文生图 (Text-to-Image)**: 对接 **LibLibAI** 平台,支持丰富的 Checkpoint、LoRA 模型和参数,将您的想法变为精美图像。
- **图生视频 (Image-to-Video)**: 调用火山引擎 **即梦(Jimeng)I2V** 模型,为静态图片赋予生命,生成平滑自然的动态视频。
- **文生音乐 (Text-to-Music)**: 接入火山引擎 **即梦(Jimeng)音乐** 模型,通过文本描述(如风格、情绪、乐器)即可生成独一无二的背景音乐。
- **自动合成 (Automatic Merging)**: 使用强大的 **FFmpeg** 引擎,将生成的视频画面与背景音乐无缝合成为最终的成品视频。
- **💡 AI驱动的灵感引擎**:
- 内置基于 **豆包(Doubao)大模型** 的提示词生成器。
- 提供“美女”、“Labubu”等多种预设主题,只需勾选想要的风格(如“沙滩”、“健身房”或“糖果系”、“魔法系”),即可一键生成全套专业的图片、音乐提示词和爆款标题、标签。
- **🎨 直观的图形化界面 (GUI)**:
- **三步式工作流**: 清晰地将创作过程分为“文生图 → 图生视频 → 文生音乐与合成”三个阶段,每一步的进展和结果都一目了然。
- **集中式参数管理**: 在统一的界面中配置所有AI模型的参数,无需在多个网页或应用间切换。
- **实时媒体预览**: 生成的图片和视频会直接在界面中展示和播放,方便您即时评估效果。
- **历史记录与导航**: 支持在多张生成的图片之间轻松切换,方便您选择最满意的一张进入下一步。
## 📸 软件截图
软件主界面:提示词生成部分。
软件主界面:图像参数部分。
生成示例:生成图像。
生成示例:最终视频。
## 🚀 快速开始
### 系统要求
1. **Python**: 3.8 或更高版本。
2. **FFmpeg**: **必须**安装 FFmpeg 并将其添加到系统环境变量中。
- 请访问 [FFmpeg 官网](https://ffmpeg.org/download.html) 查看安装教程。
- 检查是否安装成功:打开终端或命令提示符,输入 `ffmpeg -version`。
3. **API Keys**:
- **豆包(Doubao) API Key**: 用于提示词生成。
- **LibLibAI Access Key & Secret Key**: 用于文生图。
- **火山引擎(即梦)Access Key & Secret Key**: 用于图生视频和文生音乐。
### 安装与启动
1. **克隆本仓库:**
```bash
git clone https://github.com/toki-plus/ai-video-workflow.git
cd ai-video-workflow
```
2. **创建并激活虚拟环境 (推荐):**
```bash
python -m venv venv
# Windows 系统
venv\Scripts\activate
# macOS/Linux 系统
source venv/bin/activate
```
3. **安装依赖库:**
```bash
pip install -r requirements.txt
```
4. **配置 API Keys:**
- **强烈建议**通过设置系统环境变量来配置密钥,程序会自动读取:
- `DOUBAO_API_KEY`
- `LIBLIB_AK`, `LIBLIB_SK`
- `JIMENG_AK`, `JIMENG_SK`
- 或者,您也可以在软件启动后,在 "API 密钥" 标签页中手动输入。
5. **运行程序:**
```bash
python ai_video_workflow.py
```
## 📖 使用指南
1. **第一步:配置与准备**
- 启动软件,在左侧的 "API 密钥" 标签页中确认所有密钥已填写正确,点击“保存当前参数”应用。
- 切换到 "提示词生成" 标签页,选择一个您感兴趣的主题(如“美女”),勾选几个场景,然后点击“生成提示词”。
- 在下方生成的表格中,选择最喜欢的一行,点击“应用选中行提示词”。
2. **第二步:文生图**
- 参数会自动填充到“图像参数”和“音视频参数”标签页,您也可以手动修改。
- 在右侧工作流面板,点击“开始生成图片”。等待片刻,生成的图片将显示在预览区。
- 您可以多次生成,并通过“上一张”/“下一张”按钮选择最满意的图片。
3. **第三步:图生视频**
- 确认已选中满意的图片后,点击“生成视频”。程序会将该图片发送到AI模型进行处理。
- 处理完成后,生成的无声视频会自动在预览区循环播放。
4. **第四步:文生音乐与合成**
- 点击“合成最终视频”。程序将使用“音视频参数”中的音乐提示词生成配乐,并与视频合并。
- 任务完成后,最终的带配乐视频将在预览区播放,并保存在 `output` 文件夹中。
5. **完成!**
- 点击“全部重来”可以清空当前状态,开始一次全新的创作。
---
技术交流,请添加:
个人微信
微信号: toki-plus (请备注“GitHub 定制”)
公众号
获取最新技术分享与项目更新
## 📂 我的其他开源项目
- **[Netease Downloader](https://github.com/toki-plus/netease-downloader)**: 一款优雅、功能丰富的网易云音乐下载器,支持无损/高品质音质、歌单/专辑批量下载、扫码登录和自动写入ID3元数据。
- **[AI-Trader-For-MT4](https://github.com/toki-plus/ai-trader-for-mt4)**: 革命性开源框架,将大语言模型(LLM)转变为能在MetaTrader 4(MT4)平台上进行自主交易的AI代理。
- **[Auto USPS Tracker](https://github.com/toki-plus/auto-usps-tracker)**: 专为跨境电商卖家设计的高效USPS批量物流追踪器,支持防屏蔽抓取并生成精美Excel报告。
- **[AI Mixed Cut](https://github.com/toki-plus/ai-mixed-cut)**: 一款颠覆性的AI内容生产工具,通过“解构-重构”模式将爆款视频解构成创作素材库,并全自动生成全新原创视频。
- **[AI Highlight Clip](https://github.com/toki-plus/ai-highlight-clip)**: 一款AI驱动的智能剪辑工具,能够全自动地从长视频中分析、发现并剪辑出多个“高光时刻”短视频,并自动生成爆款标题。
- **[AI TTV Workflow](https://github.com/toki-plus/ai-ttv-workflow)**: 一款AI驱动的文本转视频工具,能将任意文案自动转化为带有配音、字幕和封面的短视频,支持AI文案提取、二创和翻译。
- **[AB Video Deduplicator](https://github.com/toki-plus/AB-Video-Deduplicator)**: 通过创新的“高帧率抽帧混合”技术,从根本上重构视频数据指纹,以规避主流短视频平台的原创度检测和查重机制。
- **[Video Mover](https://github.com/toki-plus/video-mover)**: 一个强大的、全自动化的内容创作流水线工具。它可以自动监听、下载指定的博主发布的视频,进行深度、多维度的视频去重处理,并利用AI大模型生成爆款标题,最终自动发布到不同平台。
## 🤝 参与贡献
欢迎任何形式的贡献!如果你有新的功能点子、发现了Bug,或者有任何改进建议,请:
- 提交一个 [Issue](https://github.com/toki-plus/ai-video-workflow/issues) 进行讨论。
- Fork 本仓库并提交 [Pull Request](https://github.com/toki-plus/ai-video-workflow/pulls)。
如果这个项目对你有帮助,请不吝点亮一颗 ⭐!
## 📜 开源协议
本项目基于 MIT 协议开源。详情请见 [LICENSE](LICENSE) 文件。