https://github.com/yyhago/gemini-ai-audio
Base de uma projeto que permite transcrever arquivos de áudio em português ou inglês e traduzi-los para diferentes idiomas usando IA. Construido com Python, interface em Streamlit e consumindo API do Google Gemini
https://github.com/yyhago/gemini-ai-audio
artificial-intelligence python streamlit
Last synced: 7 days ago
JSON representation
Base de uma projeto que permite transcrever arquivos de áudio em português ou inglês e traduzi-los para diferentes idiomas usando IA. Construido com Python, interface em Streamlit e consumindo API do Google Gemini
- Host: GitHub
- URL: https://github.com/yyhago/gemini-ai-audio
- Owner: yyhago
- Created: 2025-05-21T17:14:45.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2025-05-21T17:45:11.000Z (about 1 year ago)
- Last Synced: 2025-11-09T09:11:46.057Z (8 months ago)
- Topics: artificial-intelligence, python, streamlit
- Language: Python
- Homepage:
- Size: 149 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Tradutor de Áudio
Base de uma aplicação que permite transcrever arquivos de áudio em português e traduzi-los para diferentes idiomas usando IA.
## 🖼️ Projeto:

## Funcionalidades
- Upload de arquivos de áudio em formato MP3 ou WAV
- Player de áudio incorporado
- Transcrição automática para português
- Tradução para vários idiomas usando a API Gemini
- Interface amigável construída com Streamlit
## Tecnologias Utilizadas
- **Frontend e Backend**: Streamlit
- **Transcrição de Áudio**: SpeechRecognition
- **Processamento de Áudio**: Pydub
- **Tradução de Texto**: Google Gemini API
- **Gerenciamento de Configuração**: python-dotenv
## Como Configurar
### Pré-requisitos
- Python 3.8 ou superior
- Chave API do Google Gemini
### Instalação
1. Clone este repositório ou faça o download dos arquivos
2. Instale as dependências:
```
pip install -r requirements.txt
```
3. Crie um arquivo `.env` na raiz do projeto com sua chave API do Gemini:
```
GEMINI_API_KEY=sua_chave_api_aqui
```
4. Execute a aplicação:
```
streamlit run app.py
```
## Como Obter a API do Gemini
1. Acesse [Google AI Studio](https://makersuite.google.com/app/apikey)
2. Crie ou faça login em sua conta Google
3. Crie um novo projeto se necessário
4. Gere uma nova chave API
5. Copie a chave e adicione ao arquivo `.env`
## Como Usar a Aplicação
1. Faça o upload de um arquivo de áudio (MP3 ou WAV)
2. Selecione o idioma de destino para tradução
3. Clique no botão "Transcrever e Traduzir"
4. Visualize o texto transcrito e o texto traduzido
## Observações
- A precisão da transcrição pode variar dependendo da qualidade do áudio
- O aplicativo suporta transcrição de áudio em português do Brasil (pt-BR) e Inglês
- A tradução é limitada pelos idiomas suportados pela API Gemini
## Resolução de Problemas
- Se encontrar o erro "No module named 'x'", verifique se todas as dependências foram instaladas: `pip install -r requirements.txt`
- Se houver problemas com a transcrição, verifique se o arquivo de áudio está em um formato suportado (MP3 ou WAV) e se está claro o suficiente
- Para problemas com a API Gemini, verifique se a chave API está correta e se há créditos disponíveis em sua conta