https://github.com/vb64/whisper.rttm
Whisper transcription with nemo rttm file.
https://github.com/vb64/whisper.rttm
Last synced: 11 months ago
JSON representation
Whisper transcription with nemo rttm file.
- Host: GitHub
- URL: https://github.com/vb64/whisper.rttm
- Owner: vb64
- Created: 2025-04-25T06:49:20.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2025-07-08T19:26:17.000Z (12 months ago)
- Last Synced: 2025-07-08T20:35:06.835Z (12 months ago)
- Language: Python
- Homepage:
- Size: 386 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Преобразование mp3 в текст с назначением спикеров из rttm файла
## Настройка под Windows.
Предварительно установить следующие программы.
- GNU [Unix Utils](http://unxutils.sourceforge.net/) для операций через makefile
- [Git for Windows](https://git-scm.com/download/win) для доступа к репозитарию исходных кодов.
- [Python3.10.11](https://www.python.org/downloads/release/python-31011/)
- [ffmpeg](https://ffmpeg.org/download.html) (распаковать архив и добавить в PATH)
- [Perl](https://strawberryperl.com/)
- build tools by installing [Microsoft Visual Studio](https://visualstudio.microsoft.com/downloads/)
## Настройка под Ubuntu. 24.04
```
sudo apt update
sudo apt-get install build-essential python3.12-venv python3-pip ffmpeg screen curl
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
```
## Установка программы
```bash
git clone https://github.com/vb64/whisper.rttm.git
cd whisper.rttm
make setup PYTHON_BIN=python3
```
## Ссылки
- [Адаптация языковой модели vosk](https://habr.com/ru/articles/735480/)
- [Сравнение Vosk и Whisper](https://habr.com/ru/articles/814057/)