https://github.com/matcom/scr_pasd_2025

Repositorio para le entrega del tercer proyecto de la asignatura Sistemas Computacionales y Redes. 2025
https://github.com/matcom/scr_pasd_2025

Last synced: 4 months ago
JSON representation

Repositorio para le entrega del tercer proyecto de la asignatura Sistemas Computacionales y Redes. 2025

Host: GitHub
URL: https://github.com/matcom/scr_pasd_2025
Owner: matcom
License: mit
Created: 2025-05-20T00:32:30.000Z (about 1 year ago)
Default Branch: main
Last Pushed: 2025-05-20T00:33:01.000Z (about 1 year ago)
Last Synced: 2025-06-30T12:06:56.429Z (12 months ago)
Homepage:
Size: 4.88 KB
Stars: 0
Watchers: 3
Forks: 4
Open Issues: 5
Metadata Files:
- Readme: README.md
- License: LICENSE

Awesome Lists containing this project

README

### **Proyecto Plataforma de Aprendizaje Supervisado Distribuido**

#### **Descripción:**
El proyecto consiste en desarrollar una plataforma capaz de entrenar y desplegar modelos de **aprendizaje supervisado** de manera distribuida, utilizando **Ray**, **Docker** y **Scikit-Learn**. La plataforma debe procesar conjuntos de datos etiquetados, entrenar múltiples modelos en paralelo y ponerlos en producción mediante una API funcional. El sistema debe reflejar los conceptos de computación distribuida aprendidos en el curso, garantizando escalabilidad, tolerancia a fallos y eficiencia.

#### **Fases del Proyecto**

1. **Entrenamiento Distribuido**
- Implementar un sistema que permita el entrenamiento simultáneo de múltiples modelos de *machine learning* sobre un mismo dataset.
- Soporte para cargar y procesar datos en un entorno distribuido.

2. **Despliegue de Modelos (Serving)**
- Desarrollo de una **API** REST o programática para interactuar con los modelos entrenados.
- Integración con contenedores Docker para garantizar portabilidad y reproducibilidad con autodescubrimiento.

3. **Monitoreo y Visualización**
- Generación de gráficas que muestren:
- Métricas de rendimiento durante el entrenamiento (ej: precisión, pérdida).
- Estadísticas de inferencia en producción (ej: latencia, uso de recursos).

#### **Criterios de Evaluación**
- ✅ Diseño de un **sistema distribuido** que cumpla con las funcionalidades básicas y opcionales.
- ✅ Implementación de **tolerancia a fallos** (ej: replicación de nodos, *autodescubrimiento*).
- ✅ Capacidad de entrenar **múltiples datasets secuencialmente** en una misma ejecución.
- ✅ Uso eficiente de **Ray** para gestión de tareas y recursos.

#### **Funcionalidades Adicionales**
1. Entrenamiento y *serving* de **varios datasets simultáneamente**.
2. **Estadísticas avanzadas**: Comparativa de modelos, análisis de tendencias, etc.
3. Eliminación del **punto único de fallo** en el líder del clúster.
4. **Interfaz gráfica** (GUI) para gestión y visualización del sistema.
5. **Seguridad**: Encriptación de comunicaciones y autenticación de nodos.

---

- **Entrega**: 22 Junio 11:59:59 pm

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/matcom/scr_pasd_2025

Awesome Lists containing this project

README