https://github.com/powerfulyang/subtitle
https://github.com/powerfulyang/subtitle
Last synced: about 1 month ago
JSON representation
- Host: GitHub
- URL: https://github.com/powerfulyang/subtitle
- Owner: powerfulyang
- Created: 2025-06-26T04:27:25.000Z (3 months ago)
- Default Branch: master
- Last Pushed: 2025-07-03T10:32:05.000Z (3 months ago)
- Last Synced: 2025-07-03T11:42:31.196Z (3 months ago)
- Language: Python
- Size: 14.6 KB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# SRT字幕生成器
一个基于OpenAI Whisper的音频/视频文件自动字幕生成工具,提供RESTful API接口,支持多种媒体格式,自动生成SRT格式字幕文件。
## 功能特性
- 🎬 支持音频和视频文件的字幕生成
- 🌐 提供RESTful API接口,便于集成
- 🚀 基于faster-whisper,提供高性能推理
- 💾 自动临时文件管理和清理
- 🔧 支持GPU和CPU运行环境
- 📝 输出标准SRT格式字幕文件
- 🌍 支持多语言音频识别## 系统要求
### 基础环境
- Python 3.10 或更高版本
- Windows 10+ / Linux / macOS### 硬件要求
- **推荐配置**: NVIDIA GPU (支持CUDA)
- **最低配置**: CPU (性能较低但可运行)## 安装说明
### 1. 克隆项目
```bash
git clone https://github.com/powerfulyang/subtitle.git
cd subtitle
```### 2. 安装Python依赖
```bash
pip install -r requirements.txt
```### 3. 安装PyTorch (关键步骤)
**⚠️ 重要提示**: 请根据您的硬件配置选择合适的PyTorch版本
#### GPU版本 (推荐,需要NVIDIA显卡)
如果您的电脑有NVIDIA显卡,请安装GPU版本以获得最佳性能:
1. **检查CUDA版本**:
```bash
nvidia-smi
```2. **安装对应的PyTorch版本**:
**CUDA 11.8**:
```bash
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
```
**CUDA 12.6**:
```bash
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
```**CUDA 12.8**:
```bash
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128
```
#### CPU版本 (无显卡或显卡不兼容时使用)如果您的电脑没有NVIDIA显卡或希望仅使用CPU:
```bash
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu
```**注意**: CPU版本的处理速度明显慢于GPU版本,建议用于测试或轻量使用场景。
### 4. 安装 audio-separator
主要应对音频分离需求,如音频中包含多种音轨(如音乐和人声)时,使用音频分离器可以提高字幕生成的准确性。
如果您希望使用CPU版本的音频分离器(适用于无GPU或显卡不兼容的情况):
```bash
pip install "audio-separator[cpu]"
```如果您希望使用GPU版本的音频分离器(推荐):
```bash
pip install "audio-separator[gpu]"
```## 使用方法
### 方式一:直接启动 (开发/测试)
```bash
python main.py
```服务将在 `http://localhost:8002` 启动。
## 技术栈
- **后端框架**: FastAPI
- **AI模型**: OpenAI Whisper (via faster-whisper)
- **深度学习**: PyTorch
- **API文档**: 自动生成 (访问 `/docs`)## 许可证
本项目采用开源许可证,详见项目根目录的LICENSE文件。
## 支持与反馈
如遇问题或有改进建议,欢迎提交Issue或Pull Request。
---
**注意**: 首次使用时,系统会自动下载Whisper模型文件,请确保网络连接正常。GPU版本可显著提升处理速度,强烈推荐有NVIDIA显卡的用户安装GPU版本的PyTorch。