https://github.com/fgonzalesc/transcripcion_ai
Transcripción de audios con Azure Speech y extracción de insights con Open AI
https://github.com/fgonzalesc/transcripcion_ai
ai azure dataprocessing diarization openai-api python speechtotext
Last synced: about 2 months ago
JSON representation
Transcripción de audios con Azure Speech y extracción de insights con Open AI
- Host: GitHub
- URL: https://github.com/fgonzalesc/transcripcion_ai
- Owner: FGonzalesc
- License: mit
- Created: 2025-03-16T00:43:44.000Z (2 months ago)
- Default Branch: main
- Last Pushed: 2025-03-16T17:19:17.000Z (2 months ago)
- Last Synced: 2025-03-31T03:32:45.963Z (about 2 months ago)
- Topics: ai, azure, dataprocessing, diarization, openai-api, python, speechtotext
- Language: Python
- Homepage:
- Size: 2.56 MB
- Stars: 1
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# 🎙️ Transcripcion_AI: Transcribe y Analiza Conversaciones con Azure y OpenAI
📌 **Transcripcion_AI** es un sistema avanzado que convierte audios en texto con **Azure Speech-to-Text**, identifica diferentes hablantes con **diarización** y analiza la conversación con **OpenAI** para extraer información clave en formato JSON.
---
## 🚀 Características principales
✅ **Transcripción de audio** con Microsoft Azure
✅ **Diarización de hablantes** para separar quién dice qué
✅ **Análisis de insights** con OpenAI (GPT)
✅ **Generación de JSON estructurado** con información clave
✅ **Código modular y escalable** para integraciones futuras---
## 🏗️ Tecnologías utilizadas
- 🟢 **Python** - Lenguaje principal del proyecto
- 🔷 **Azure Cognitive Services** - Para Speech-to-Text
- 🤖 **OpenAI API** - Para análisis de texto e insights
- 🗄️ **JSON** - Para almacenar resultados estructurados---
## 📂 Estructura del Proyecto
```yaml
Transcripcion_AI/
│── transcripcion/
│ ├── __init__.py
│ ├── transcriber.py
│
│── procesamiento/
│ ├── __init__.py
│ ├── openai_processor.py
│
│── app.py
│── config.py # Archivo de configuración (usa el config.example.py)
│── requirements.txt
│── Audio.wav
│── README.md
│── LICENSE.txt
```
---## 🎯 Casos de Uso
🔹 **Centros de llamadas:** Automatización del análisis de conversaciones
🔹 **Empresas financieras:** Detección de necesidades de clientes
🔹 **Atención al cliente:** Extracción de insights para mejorar el servicio---
## 🛠️ Instalación y Configuración
### 1️⃣ Clona el repositorio:
Abre una terminal y ejecuta los siguientes comandos para clonar el repositorio y acceder a la carpeta del proyecto:```bash
git clone https://github.com/TU-USUARIO/Transcripcion_AI.git
cd Transcripcion_AI
```### 2️⃣ Instala las dependencias:
Ejecuta el siguiente comando:
```bash
pip install -r requirements.txt
```### 3️⃣ Configura las claves en config.py:
Abre el archivo config.py y reemplaza las claves con las tuyas:
```python
SPEECH_KEY = "TU_AZURE_KEY"
SPEECH_REGION = "eastus"
OPENAI_API_KEY = "TU_OPENAI_KEY"
```
### 4️⃣ Ejecuta el programa::
Ejecuta el siguiente comando para iniciar la transcripción:
```bash
python app.py
```