https://github.com/rociobenitez/bigdata-fundamentals-notes
Colección práctica de apuntes sobre Java, Scala, Hadoop, Spark, Hive y más.
https://github.com/rociobenitez/bigdata-fundamentals-notes
big-data hadoop hive java scala spark sql-server
Last synced: about 2 months ago
JSON representation
Colección práctica de apuntes sobre Java, Scala, Hadoop, Spark, Hive y más.
- Host: GitHub
- URL: https://github.com/rociobenitez/bigdata-fundamentals-notes
- Owner: rociobenitez
- Created: 2025-06-01T08:05:40.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2025-06-02T05:31:24.000Z (about 1 year ago)
- Last Synced: 2025-07-03T07:46:10.615Z (12 months ago)
- Topics: big-data, hadoop, hive, java, scala, spark, sql-server
- Language: Jupyter Notebook
- Homepage:
- Size: 4.12 MB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
Big Data Fundamentals Notes
Notas personales y prácticas sobre Big Data, frameworks y lenguajes asociados.
## Estructura de carpetas
```markdown
/Lenguajes
├─ Java/
└─ Scala/
/CLI
└─ Consola/
/Frameworks
├─ Hadoop/
├─ Hive/
└─ Spark/
/Distribuciones
└─ Cloudera/
/BasesDeDatos
└─ SQL-Server/
/Conceptos
└─ Arquitectura-Big-Data/
```
| Carpeta | Descripción |
| ----------------------------------------------------------- | -------------------------------------------------------------------------------------------- |
| [Java](Lenguajes/Java/) | Sintaxis, conceptos fundamentales y ejemplos de Java aplicados a Big Data. |
| [Scala](Lenguajes/Scala/) | Sintaxis, colecciones inmutables, pattern matching y ejemplos de Spark en Scala. |
| [Consola](CLI/Consola/) | Comandos de terminal (bash/zsh), scripting y utilidades para entornos Big Data. |
| [Hadoop](Frameworks/Hadoop/) | Configuración de HDFS, ejecución de jobs MapReduce y tuning de clúster. |
| [Hive](Frameworks/Hive/) | Sintaxis de HiveQL, gestión de tablas, particionado y optimización de consultas. |
| [Spark](Frameworks/Spark/) | Conceptos de RDDs, DataFrames, Spark SQL y desarrollo de aplicaciones distribuidas. |
| [Cloudera](Distribuciones/Cloudera/) | Guías de instalación y gestión de Cloudera Manager y CDH. |
| [SQL-Server](BasesDeDatos/SQL-Server/) | Administración de instancias, T-SQL avanzado e integración con entornos Big Data. |
| [Arquitecturas-Big-Data](Conceptos/Arquitecturas-Big-Data/) | Arquitecturas Lambda/Kappa, procesamiento batch vs streaming, ETL/ELT y patrones de ingesta. |