An open API service indexing awesome lists of open source software.

https://github.com/juanparias29/bigdataprocessing

Repositorio con proyectos y laboratorios de procesamiento de datos utilizando Databricks, Apache Spark y Python. Incluye conceptos clave de Big Data, almacenamiento, procesamiento, análisis y aprendizaje automático.
https://github.com/juanparias29/bigdataprocessing

apache-spark bigdata bigdataanalytics bigdatainfrastructure data-science database nosql-database python sql

Last synced: 3 months ago
JSON representation

Repositorio con proyectos y laboratorios de procesamiento de datos utilizando Databricks, Apache Spark y Python. Incluye conceptos clave de Big Data, almacenamiento, procesamiento, análisis y aprendizaje automático.

Awesome Lists containing this project

README

          

# Repositorio de Procesamiento de Big Data

Este repositorio contiene proyectos y laboratorios relacionados con el curso de procesamiento de datos. Se exploran conceptos clave de Big Data, tecnologías empresariales para BI, almacenamiento y procesamiento de datos a gran escala con herramientas especializadas.

## 📌 Contenidos Temáticos
- Almacenamiento y procesamiento de Big Data
- Bases de Datos NoSQL y SQL
- Datalakes y su implementación
- Big Data analytics y visualización de datos
- Aprendizaje Supervisado y No Supervisado con Big Data
- Procesamiento de datos en Streaming y Grafos

## 🚀 Tecnologías y Herramientas Utilizadas
- **Databricks**: Plataforma unificada para el análisis y procesamiento de datos
- **Apache Spark**: Motor de procesamiento distribuido
- **Python**: Lenguaje principal para la manipulación y análisis de datos

## 🚀 Colaborador
- **[Juan Pablo Arias](https://github.com/JuanParias29/Perfil_GitHub)**

## 📅 Curso
**Procesamiento de Datos a Gran Escala**
📍 *Pontificia Universidad Javeriana*
👨‍🏫 *Docente:* [John Corredor, PhD](https://github.com/corredor-john)

¡Bienvenido a este viaje por el mundo de Big Data! 🚀