https://github.com/estevan-ulian/py-agent-voice

Um projeto para lidar com interações de voz entre humano e agente de I.A. permitindo a leitura e análise de dados de um arquivo CSV.
https://github.com/estevan-ulian/py-agent-voice

agent-based-modeling data-analysis python3 whisper-ai

Last synced: about 1 year ago
JSON representation

Um projeto para lidar com interações de voz entre humano e agente de I.A. permitindo a leitura e análise de dados de um arquivo CSV.

Host: GitHub
URL: https://github.com/estevan-ulian/py-agent-voice
Owner: estevan-ulian
Created: 2025-04-09T11:46:48.000Z (about 1 year ago)
Default Branch: main
Last Pushed: 2025-04-09T17:44:41.000Z (about 1 year ago)
Last Synced: 2025-04-11T04:43:55.715Z (about 1 year ago)
Topics: agent-based-modeling, data-analysis, python3, whisper-ai
Language: Python
Homepage:
Size: 121 KB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# Py-Agent-Voice

Py-Agent-Voice é um projeto baseado em Python para lidar com interações entre humano e agente de I.A. permitindo a leitura e análise de dados de um arquivo CSV.

## Funcionalidades

- Análise de dados
- Reconhecimento e transcrição de voz
- Interação por voz com Agente de I.A.

## Instalação

```bash
git clone https://github.com/estevan-ulian/py-agent-voice.git
cd py-agent-voice
pip install -r requirements.txt
```

## Uso
- Crie um arquivo nomeado como `.env` e insira sua chave `OPENAI_API_KEY`. Acesse [OpenAI API Keys](https://platform.openai.com/settings/organization/api-keys) para obter sua chave de API.
- Insira seu arquivo CSV no diretório `datasets`.
- Acesse o arquivo `app.py`, vá até a linha 124, onde a classe TalkingLLM é instanciada e defina o nome do seu arquivo CSV. Por padrão é utilizado o arquivo `df_rent.csv` como exemplo.
- Execute o script principal para iniciar a aplicação:
```bash
python app.py
```
- Aguarde a inicialização.
- Pressione `` para iniciar a gravação do seu áudio.
- Faça sua pergunta e pressione `` novamente para parar a gravação.
- O agente irá processar sua pergunta e gerar uma resposta.
- O áudio da resposta será reproduzido automaticamente.
- Aguarde a conclusão do agente para fazer uma nova pergunta.

Você pode alterar a tecla de gravação na instância da classe TalkingLLM alterando o parâmetro `key_press`, definido como `` por padrão. Confira a documentação do `pynput` para mais opções de teclas: [documentação do pynput](https://pynput.readthedocs.io/en/latest/keyboard.html#pynput.keyboard.Key).

Para sair do programa pressione `ctrl + c` se estiver em um ambiente Windows ou `cmd + c` se estiver em um ambiente MacOS.

## Licença

Este projeto está licenciado sob a Licença MIT.

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/estevan-ulian/py-agent-voice

Awesome Lists containing this project

README