https://github.com/rafaluz/scraping-to-speech

🎙️ Projeto scraping-to-speech: Geração de voz a partir de texto via web scraping com Streamlit. Converte textos longos em áudios usando vozes realistas do site openai.fm.
https://github.com/rafaluz/scraping-to-speech

automation openai python selenium streamlit text-to-speech voice-generation web-scraping

Last synced: 3 months ago
JSON representation

🎙️ Projeto scraping-to-speech: Geração de voz a partir de texto via web scraping com Streamlit. Converte textos longos em áudios usando vozes realistas do site openai.fm.

Host: GitHub
URL: https://github.com/rafaluz/scraping-to-speech
Owner: rafaluz
Created: 2025-05-24T17:45:05.000Z (about 1 year ago)
Default Branch: main
Last Pushed: 2025-05-24T17:55:06.000Z (about 1 year ago)
Last Synced: 2025-06-03T05:28:11.072Z (about 1 year ago)
Topics: automation, openai, python, selenium, streamlit, text-to-speech, voice-generation, web-scraping
Language: Python
Homepage:
Size: 131 KB
Stars: 0
Watchers: 0
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# Scraping to Speech

![Interface](interface.PNG)

**Scraping to Speech** é uma aplicação em Python com interface em Streamlit que permite gerar áudios realistas a partir de um texto, usando vozes do site [https://www.openai.fm/](https://www.openai.fm/). A geração é feita via web scraping, simulando interações reais na página com Selenium.

---

## 🌍 Visão Geral

O usuário insere:

* Um **texto longo (prompt)**
* **Instruções de entonação e estilo**
* A **voz desejada** (ex: Ash, Nova, Coral...)

O sistema divide o texto em partes de até 999 caracteres, envia cada uma ao site openai.fm, gera os áudios, baixa automaticamente e permite baixar todos em um .zip.

---

## 🧱 Tecnologias utilizadas

* **Python 3.10+**
* **Streamlit** — para a interface web
* **Selenium + ChromeDriver** — para automação de interações no site
* **BeautifulSoup** (opcional, não essencial neste projeto)
* **zipfile** — para empacotamento dos áudios
* **Pydub** — (caso queira manipular os áudios futuramente)

---

## ⚡ Como rodar o projeto

1. **Clone o repositório:**

```bash
git clone https://github.com/seu-usuario/scraping-to-speech.git
cd scraping-to-speech
```

2. **Crie um ambiente virtual (recomendado):**

```bash
python -m venv env
source env/bin/activate # Linux/macOS
env\Scripts\activate # Windows
```

3. **Instale as dependências:**

```bash
pip install -r requirements.txt
```

4. **Execute a aplicação:**

```bash
streamlit run app.py
```

5. Acesse no navegador:

```
http://localhost:8501
```

> Obs: Certifique-se de que o **ChromeDriver** está instalado e compatível com a sua versão do Google Chrome.
> Você pode baixar em: [https://sites.google.com/a/chromium.org/chromedriver/](https://sites.google.com/a/chromium.org/chromedriver/)

---

## 🔍 Exemplo de uso

1. Digite seu texto longo no campo "Prompt"
2. Ajuste as instruções de estilo, entonação e pontuação
3. Escolha uma das 11 vozes disponíveis
4. Clique em **Gerar Voz**
5. Ao final, clique em **Baixar todos os áudios** para obter um .zip com as partes

---

## 🚧 Diretórios ignorados

Certos arquivos e pastas não são versionados:

* `audio_downloads/`: onde os áudios são salvos temporariamente
* `env/`: ambiente virtual
* `*.zip`: pacotes gerados para download

> Veja o arquivo `.gitignore` para a lista completa.

---

## 🌐 Licença

Este projeto é de uso pessoal/demonstrativo e não está afiliado oficialmente à OpenAI ou à plataforma openai.fm.

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/rafaluz/scraping-to-speech

Awesome Lists containing this project

README