https://github.com/cewitte/gopabx
Go app to generate text-to-speech MP3 using Google Cloud's text-to-speech service.
https://github.com/cewitte/gopabx
Last synced: about 2 months ago
JSON representation
Go app to generate text-to-speech MP3 using Google Cloud's text-to-speech service.
- Host: GitHub
- URL: https://github.com/cewitte/gopabx
- Owner: cewitte
- Created: 2020-02-05T22:43:56.000Z (over 6 years ago)
- Default Branch: master
- Last Pushed: 2020-12-21T20:53:03.000Z (over 5 years ago)
- Last Synced: 2025-12-07T11:32:27.636Z (6 months ago)
- Language: Go
- Size: 1.21 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# gopabx
Um gerador de textos para URAs feito em Go (Golang), que utiliza as APIs de text-to-speech to Google Cloud.
## Importante
Para usar esse app, você precisará configurar sua conta no Google Cloud, projeto, credenciais, etc. Eu não poderia explicar melhor do que faz o Google [aqui](https://cloud.google.com/text-to-speech/docs/quickstart-client-libraries?hl=pt-br).
A propósito, meu código usa como base o código disponível no Guia de início rápido do artigo linkado acima, com algumas diferenças:
1. Eu setei a única voz (feminina, baseada em Wavenet) disponível em português do Brasil.
1. Ao invés de utilizar uma `string` dentro do próprio código, meu código espera receber um arquivo `ssml` como argumento na linha de comando, por exemplo:
`go run main.go -ssml=arquivo.ssml`
Se o nome é `arquivo.ssml`, ao terminar o app terá gerado um mp3 de nome `arquivo.mp3` no diretório raiz da aplicação.
## Sobre o SSML
A linguagem de marcação de síntese de fala (SSML, na sigla em inglês) tem sintaxe similar ao XML e permite controle maior sobre o resultado da voz sintetizada com pausas, formatação de áudio para acrônimos, datas, horas e abreviaturas ou texto a ser censurado.
Você pode ver alguns exemplos na própria raiz do repositório.
O Google tem uma página bem explicativa sobre como [formatar o SSML](https://cloud.google.com/text-to-speech/docs/ssml?hl=pt-br).
## Antes de executar - uso da API do Google
Antes de executar o programa, é necessário carregar o arquivo com as credenciais JSON. No meu caso, por exemplo (no meu Linux)
`export GOOGLE_APPLICATION_CREDENTIALS="/home/cewitte/GCP/pabx-58f1caa85116.json"`
No meu Mac, por exemplo:
`export GOOGLE_APPLICATION_CREDENTIALS="/Users/cewitte/GCP/pabx-58f1caa85116.json"`