https://github.com/carlosandresamp/cosmo
"COSMO" é um bot de fala interativo desenvolvido com HTML, CSS, JavaScript e Python, usando a API GEMINI para processamento de linguagem natural e síntese de voz. A aplicação permite comunicação verbal com o bot, que interpreta o discurso e responde de forma natural e humanizada
https://github.com/carlosandresamp/cosmo
Last synced: about 2 months ago
JSON representation
"COSMO" é um bot de fala interativo desenvolvido com HTML, CSS, JavaScript e Python, usando a API GEMINI para processamento de linguagem natural e síntese de voz. A aplicação permite comunicação verbal com o bot, que interpreta o discurso e responde de forma natural e humanizada
- Host: GitHub
- URL: https://github.com/carlosandresamp/cosmo
- Owner: carlosandresamp
- Created: 2024-10-25T15:56:50.000Z (7 months ago)
- Default Branch: main
- Last Pushed: 2025-03-20T12:05:45.000Z (2 months ago)
- Last Synced: 2025-03-20T13:35:37.469Z (2 months ago)
- Language: HTML
- Homepage:
- Size: 1.16 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
"COSMO" é um bot de fala interativo desenvolvido com HTML, CSS, JavaScript e Python, usando a API GEMINI para processamento de linguagem natural e síntese de voz. A aplicação permite comunicação verbal com o bot, que interpreta o discurso e responde de forma natural e humanizada. A interface é construída em HTML e estilizada em CSS, com um botão que ativa o reconhecimento de voz e seções para exibir o texto reconhecido e a resposta do bot. O JavaScript no front-end lida com a captura de voz e a síntese de fala. Utilizando a API Web Speech, o reconhecimento de fala converte o áudio do usuário em texto, que é exibido na interface e enviado ao servidor via chamada fetch para processamento. No back-end, o framework Flask gerencia a comunicação entre a interface e a API GEMINI. Ao receber o texto da fala do usuário, o servidor Flask usa a biblioteca https://github.com/carlosandresamp/COSMO/releases para processar a mensagem. A API GEMINI é configurada para responder de forma contextual e personalizada. A resposta é então filtrada e enviada de volta ao front-end, onde o texto é sintetizado em voz usando a API SpeechSynthesis. Essa combinação de reconhecimento de voz, processamento de linguagem natural e síntese de voz cria uma experiência de comunicação oral natural e envolvente com o bot COSMO, que responde de maneira próxima a um humano, utilizando linguagem casual e regional.