{"id":48470110,"url":"https://github.com/contraslash/hablemos-de-voz","last_synced_at":"2026-04-07T06:02:58.606Z","repository":{"id":41728696,"uuid":"235212455","full_name":"contraslash/hablemos-de-voz","owner":"contraslash","description":null,"archived":false,"fork":false,"pushed_at":"2022-12-11T21:48:25.000Z","size":13068,"stargazers_count":0,"open_issues_count":13,"forks_count":0,"subscribers_count":1,"default_branch":"master","last_synced_at":"2025-06-12T05:54:48.203Z","etag":null,"topics":[],"latest_commit_sha":null,"homepage":"https://contraslash.github.io/hablemos-de-voz/","language":"JavaScript","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/contraslash.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null}},"created_at":"2020-01-20T22:40:01.000Z","updated_at":"2021-05-21T04:45:40.000Z","dependencies_parsed_at":"2023-01-27T07:45:40.236Z","dependency_job_id":null,"html_url":"https://github.com/contraslash/hablemos-de-voz","commit_stats":null,"previous_names":[],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/contraslash/hablemos-de-voz","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/contraslash%2Fhablemos-de-voz","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/contraslash%2Fhablemos-de-voz/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/contraslash%2Fhablemos-de-voz/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/contraslash%2Fhablemos-de-voz/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/contraslash","download_url":"https://codeload.github.com/contraslash/hablemos-de-voz/tar.gz/refs/heads/master","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/contraslash%2Fhablemos-de-voz/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":31501903,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-04-07T03:10:19.677Z","status":"ssl_error","status_checked_at":"2026-04-07T03:10:13.982Z","response_time":105,"last_error":"SSL_connect returned=1 errno=0 peeraddr=140.82.121.5:443 state=error: unexpected eof while reading","robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":false,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":[],"created_at":"2026-04-07T06:02:58.037Z","updated_at":"2026-04-07T06:02:58.591Z","avatar_url":"https://github.com/contraslash.png","language":"JavaScript","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Hablemos de voz\n\nDesde que creamos los ordenadores nos hemos preguntado si serán inteligentes, Alan Turing en la prueba que lleva su nombre describió inteligencia como la capacidad de mantener una \"conversación\" con un agente y que sea indiferenciado con un humano. ¡Y la mayoría de seres humanos nos comunicamos hablando!\n\nDesde los años 60, en los laboratorios de IBM y AT\u0026T prototipos capaces de reconocer palabras han sido desarrollados y ochenta años después, los reconocedores automáticos de voz hacen parte de nuestra vida: Google Assistant, Siri, Alexa, Cortana y muchos otros.\n\nEn esta charla vamos a hablar de voz, desde lo teórico hasta lo práctico, entendiendo como esta señal de audio es muy característica dependiendo de nuestro cuerpo y nuestro idioma, como extraemos características y generamos modelos para predecir y producir voz, desde casi cero y con Python puro y duro\n\n## Estructura de la charla\n\nIntroducción y demo (5 minutos):\nPara captar la atención de los participantes, presentaré una rápida demostración de un generador de voz utilizando Python, mostrando un poco como a partir de una señal de voz es posible caracterizar y agrupar cada fonema usando Análisis de frecuencias en tiempos cortos (Short Time Frequency Analysis)\n\nFundamentación teórioca (20 minutos):\nAquí se muestra un poco la teoría clásica para la extracción de características, mostrando la transformación de la señal en coeficientes Mel que son muy populares en reconocimiento de voz y también otras técnicas para extraer características como PLP, LFCC y WPF.\nTambién se explica un poco como se pueden generar modelos acústicos utilizando Pliegues dinámicos teporales (Dynamic Time Warping), Modelos Ocultos de Markov (Hidden Markov Models) y algunos modelos basados en redes neuronales profundas (Context Dependant Hidden Markov Models with Deep Neural Networks)\nPor último como a partir de este modelo usualmente usado para reconocimiento es posible extraer vectores-i (iVectors) para la caracterización de locutor y generación de audio.\n\nImplementación en Python (20 minutos):\nEn este espacio de tiempo se muestra la implementación concreta en Python de los conceptos teóricos usando paquetes de código abierto, así como herramientas de código abierto escritas sobre Python que pueden acelerar el desarrollo de producción y reconocimiento de voz\n\nPresentación de Open Speech Corpus (5 minutos)\nSe presenta Open Speech Corpus, un proyecto de código abierto con objetivo de recolectar voces masivamente de voluntarios para crear un corpus de gran vocabulario independiente de locutor para el idioma español\n\nPreguntas (10 minutos)\n\n\n---\n\nNotas: Originalmente las diapositivas de la charla estan en el archivo [decks/index.mdx](decks/index.mdx)\n\nSin embargo para tener mas control sobre todos los componentes, se migra todo al archivo [src/slides.js](src/slides.js)\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fcontraslash%2Fhablemos-de-voz","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Fcontraslash%2Fhablemos-de-voz","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Fcontraslash%2Fhablemos-de-voz/lists"}