https://github.com/juanparias29/bigdataprocessing
Repositorio con proyectos y laboratorios de procesamiento de datos utilizando Databricks, Apache Spark y Python. Incluye conceptos clave de Big Data, almacenamiento, procesamiento, análisis y aprendizaje automático.
https://github.com/juanparias29/bigdataprocessing
apache-spark bigdata bigdataanalytics bigdatainfrastructure data-science database nosql-database python sql
Last synced: 3 months ago
JSON representation
Repositorio con proyectos y laboratorios de procesamiento de datos utilizando Databricks, Apache Spark y Python. Incluye conceptos clave de Big Data, almacenamiento, procesamiento, análisis y aprendizaje automático.
- Host: GitHub
- URL: https://github.com/juanparias29/bigdataprocessing
- Owner: JuanParias29
- Created: 2025-02-07T04:55:30.000Z (8 months ago)
- Default Branch: main
- Last Pushed: 2025-05-05T14:04:20.000Z (5 months ago)
- Last Synced: 2025-05-05T15:24:50.041Z (5 months ago)
- Topics: apache-spark, bigdata, bigdataanalytics, bigdatainfrastructure, data-science, database, nosql-database, python, sql
- Language: Jupyter Notebook
- Homepage:
- Size: 3.59 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Repositorio de Procesamiento de Big Data
Este repositorio contiene proyectos y laboratorios relacionados con el curso de procesamiento de datos. Se exploran conceptos clave de Big Data, tecnologías empresariales para BI, almacenamiento y procesamiento de datos a gran escala con herramientas especializadas.
## 📌 Contenidos Temáticos
- Almacenamiento y procesamiento de Big Data
- Bases de Datos NoSQL y SQL
- Datalakes y su implementación
- Big Data analytics y visualización de datos
- Aprendizaje Supervisado y No Supervisado con Big Data
- Procesamiento de datos en Streaming y Grafos## 🚀 Tecnologías y Herramientas Utilizadas
- **Databricks**: Plataforma unificada para el análisis y procesamiento de datos
- **Apache Spark**: Motor de procesamiento distribuido
- **Python**: Lenguaje principal para la manipulación y análisis de datos## 🚀 Colaborador
- **[Juan Pablo Arias](https://github.com/JuanParias29/Perfil_GitHub)**## 📅 Curso
**Procesamiento de Datos a Gran Escala**
📍 *Pontificia Universidad Javeriana*
👨🏫 *Docente:* [John Corredor, PhD](https://github.com/corredor-john)¡Bienvenido a este viaje por el mundo de Big Data! 🚀