An open API service indexing awesome lists of open source software.

https://github.com/murapadev/preparedataset

Una herramienta escrita en python que permite descargar un video de youtube, separarlo en pistas, tomar el vocal, cortarlo y transcribirlo.
https://github.com/murapadev/preparedataset

Last synced: 3 months ago
JSON representation

Una herramienta escrita en python que permite descargar un video de youtube, separarlo en pistas, tomar el vocal, cortarlo y transcribirlo.

Awesome Lists containing this project

README

        

# TTS Dataset Generator

Esta aplicación permite crear _datasets_ para entrenar sintetizadores de _text to speech_. Fue desarrollado por la comunidad de telegram [Deep-ESP](https://t.me/deepEspVoces).

## Requisitos

- Python 3
- Python packages (Podés instalarlos haciendo algo asi: `python -m pip install -r requirements.txt`)

## Ejemplo de uso

### 1. Descargar videos y sus subtitulos

Cargar en urls.txt los videos que queres descargar, estos deberían tener subtitulos.

Luego ejecutar `python main.py download urls.txt`

### 2. Corregir en audacity manualmente

Abrir los audios descargados en audacity, tambien importar los subtitulos yendo a File -> Import -> Labels. Corregir el timing de los labels.

![](demo.jpg)

Cuando se hayan corregido los errores de timing exportar los labels y sobreescribir los anteriores. File -> Export -> Export Labels

### 3. Cortar audios y generar dataset final

Ya podemos cortar los audios y obtener el dataset final

Comando: `python main.py cut AUDIOS_FOLDER LABELS_FOLDER`

Ejemplo: `python main.py cut output labels`