https://github.com/murapadev/preparedataset

Una herramienta escrita en python que permite descargar un video de youtube, separarlo en pistas, tomar el vocal, cortarlo y transcribirlo.
https://github.com/murapadev/preparedataset

Last synced: 3 months ago
JSON representation

Una herramienta escrita en python que permite descargar un video de youtube, separarlo en pistas, tomar el vocal, cortarlo y transcribirlo.

Host: GitHub
URL: https://github.com/murapadev/preparedataset
Owner: murapadev
Created: 2021-08-11T00:51:25.000Z (almost 4 years ago)
Default Branch: main
Last Pushed: 2021-08-16T03:59:17.000Z (almost 4 years ago)
Last Synced: 2025-03-20T14:42:40.460Z (3 months ago)
Language: Python
Size: 60.5 KB
Stars: 2
Watchers: 2
Forks: 1
Open Issues: 0
Metadata Files:
- Readme: readme.md

Awesome Lists containing this project

README

# TTS Dataset Generator

Esta aplicación permite crear _datasets_ para entrenar sintetizadores de _text to speech_. Fue desarrollado por la comunidad de telegram [Deep-ESP](https://t.me/deepEspVoces).

## Requisitos

- Python 3
- Python packages (Podés instalarlos haciendo algo asi: `python -m pip install -r requirements.txt`)

## Ejemplo de uso

### 1. Descargar videos y sus subtitulos

Cargar en urls.txt los videos que queres descargar, estos deberían tener subtitulos.

Luego ejecutar `python main.py download urls.txt`

### 2. Corregir en audacity manualmente

Abrir los audios descargados en audacity, tambien importar los subtitulos yendo a File -> Import -> Labels. Corregir el timing de los labels.

![](demo.jpg)

Cuando se hayan corregido los errores de timing exportar los labels y sobreescribir los anteriores. File -> Export -> Export Labels

### 3. Cortar audios y generar dataset final

Ya podemos cortar los audios y obtener el dataset final

Comando: `python main.py cut AUDIOS_FOLDER LABELS_FOLDER`

Ejemplo: `python main.py cut output labels`

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/murapadev/preparedataset

Awesome Lists containing this project

README