https://github.com/murapadev/preparedataset
Una herramienta escrita en python que permite descargar un video de youtube, separarlo en pistas, tomar el vocal, cortarlo y transcribirlo.
https://github.com/murapadev/preparedataset
Last synced: 3 months ago
JSON representation
Una herramienta escrita en python que permite descargar un video de youtube, separarlo en pistas, tomar el vocal, cortarlo y transcribirlo.
- Host: GitHub
- URL: https://github.com/murapadev/preparedataset
- Owner: murapadev
- Created: 2021-08-11T00:51:25.000Z (almost 4 years ago)
- Default Branch: main
- Last Pushed: 2021-08-16T03:59:17.000Z (almost 4 years ago)
- Last Synced: 2025-03-20T14:42:40.460Z (3 months ago)
- Language: Python
- Size: 60.5 KB
- Stars: 2
- Watchers: 2
- Forks: 1
- Open Issues: 0
-
Metadata Files:
- Readme: readme.md
Awesome Lists containing this project
README
# TTS Dataset Generator
Esta aplicación permite crear _datasets_ para entrenar sintetizadores de _text to speech_. Fue desarrollado por la comunidad de telegram [Deep-ESP](https://t.me/deepEspVoces).
## Requisitos
- Python 3
- Python packages (Podés instalarlos haciendo algo asi: `python -m pip install -r requirements.txt`)## Ejemplo de uso
### 1. Descargar videos y sus subtitulos
Cargar en urls.txt los videos que queres descargar, estos deberían tener subtitulos.
Luego ejecutar `python main.py download urls.txt`
### 2. Corregir en audacity manualmente
Abrir los audios descargados en audacity, tambien importar los subtitulos yendo a File -> Import -> Labels. Corregir el timing de los labels.

Cuando se hayan corregido los errores de timing exportar los labels y sobreescribir los anteriores. File -> Export -> Export Labels
### 3. Cortar audios y generar dataset final
Ya podemos cortar los audios y obtener el dataset final
Comando: `python main.py cut AUDIOS_FOLDER LABELS_FOLDER`
Ejemplo: `python main.py cut output labels`