An open API service indexing awesome lists of open source software.

https://github.com/vb64/whisper.rttm

Whisper transcription with nemo rttm file.
https://github.com/vb64/whisper.rttm

Last synced: 11 months ago
JSON representation

Whisper transcription with nemo rttm file.

Awesome Lists containing this project

README

          

# Преобразование mp3 в текст с назначением спикеров из rttm файла

## Настройка под Windows.

Предварительно установить следующие программы.

- GNU [Unix Utils](http://unxutils.sourceforge.net/) для операций через makefile
- [Git for Windows](https://git-scm.com/download/win) для доступа к репозитарию исходных кодов.
- [Python3.10.11](https://www.python.org/downloads/release/python-31011/)
- [ffmpeg](https://ffmpeg.org/download.html) (распаковать архив и добавить в PATH)
- [Perl](https://strawberryperl.com/)
- build tools by installing [Microsoft Visual Studio](https://visualstudio.microsoft.com/downloads/)

## Настройка под Ubuntu. 24.04

```
sudo apt update
sudo apt-get install build-essential python3.12-venv python3-pip ffmpeg screen curl
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
```

## Установка программы

```bash
git clone https://github.com/vb64/whisper.rttm.git
cd whisper.rttm
make setup PYTHON_BIN=python3
```

## Ссылки

- [Адаптация языковой модели vosk](https://habr.com/ru/articles/735480/)
- [Сравнение Vosk и Whisper](https://habr.com/ru/articles/814057/)