https://github.com/jerryshell/batch-groq-stt
Batch Groq STT
https://github.com/jerryshell/batch-groq-stt
audio bun flac groq json m4a mp3 mp4 mpeg mpga ogg speech-to-text srt stt txt wav webm whisper youtube yt-dlp
Last synced: 25 days ago
JSON representation
Batch Groq STT
- Host: GitHub
- URL: https://github.com/jerryshell/batch-groq-stt
- Owner: jerryshell
- License: mit
- Created: 2026-03-31T07:40:33.000Z (about 2 months ago)
- Default Branch: master
- Last Pushed: 2026-04-22T05:30:18.000Z (about 1 month ago)
- Last Synced: 2026-04-22T07:30:03.281Z (about 1 month ago)
- Topics: audio, bun, flac, groq, json, m4a, mp3, mp4, mpeg, mpga, ogg, speech-to-text, srt, stt, txt, wav, webm, whisper, youtube, yt-dlp
- Language: TypeScript
- Homepage:
- Size: 11.7 KB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Batch Groq STT
批量将 `data/` 目录下的音频文件转录为文字,支持生成 JSON、SRT 字幕和 TXT 纯文本。
## 支持的音频格式
| 格式 | 扩展名 |
| ---- | ---------------- |
| FLAC | `.flac` |
| MP3 | `.mp3` |
| MP4 | `.mp4` |
| MPEG | `.mpeg`, `.mpga` |
| M4A | `.m4a` |
| OGG | `.ogg` |
| WAV | `.wav` |
| WebM | `.webm` |
## 文件大小限制
- 免费版:最大 25MB
- 开发版:最大 100MB(超过 25MB 会显示警告)
## 环境要求
- [Bun](https://bun.com)
- [Groq API Key](https://console.groq.com/keys)
## 安装
```bash
bun install
```
## 配置
创建 `.env` 文件:
```bash
GROQ_API_KEY="your_api_key_here"
```
## 下载音频
可以使用 [yt-dlp](https://github.com/yt-dlp/yt-dlp) 从 YouTube 下载音频:
```bash
yt-dlp -t mp3 "https://www.youtube.com/watch?v=UF8uR6Z6KLc"
```
## 准备音频
将待转录的音频文件放入 `data/` 目录。
## 运行
```bash
bun run index.ts
```
## 输出
每个音频文件会生成三个文件(以 `audio.mp3` 为例):
| 文件 | 说明 |
| ------------ | ---------------------------- |
| `audio.json` | 完整转录结果(含时间戳段落) |
| `audio.srt` | SRT 字幕格式 |
| `audio.txt` | 纯文本转录内容 |
已存在的 JSON 文件会被跳过,不会重复转录。
## 脚本
```bash
bun run lint # 代码检查
bun run lint:fix # 自动修复
bun run fmt # 代码格式化
bun run fmt:check # 检查格式
```