An open API service indexing awesome lists of open source software.

https://github.com/rociobenitez/bigdata-fundamentals-notes

Colección práctica de apuntes sobre Java, Scala, Hadoop, Spark, Hive y más.
https://github.com/rociobenitez/bigdata-fundamentals-notes

big-data hadoop hive java scala spark sql-server

Last synced: about 2 months ago
JSON representation

Colección práctica de apuntes sobre Java, Scala, Hadoop, Spark, Hive y más.

Awesome Lists containing this project

README

          

Big Data Fundamentals Notes


Notas personales y prácticas sobre Big Data, frameworks y lenguajes asociados.


Java
Scala
Consola
Cloudera
Hadoop
Hive
Spark
Big Data
SQL Server

## Estructura de carpetas

```markdown
/Lenguajes
├─ Java/
└─ Scala/
/CLI
└─ Consola/
/Frameworks
├─ Hadoop/
├─ Hive/
└─ Spark/
/Distribuciones
└─ Cloudera/
/BasesDeDatos
└─ SQL-Server/
/Conceptos
└─ Arquitectura-Big-Data/
```

| Carpeta | Descripción |
| ----------------------------------------------------------- | -------------------------------------------------------------------------------------------- |
| [Java](Lenguajes/Java/) | Sintaxis, conceptos fundamentales y ejemplos de Java aplicados a Big Data. |
| [Scala](Lenguajes/Scala/) | Sintaxis, colecciones inmutables, pattern matching y ejemplos de Spark en Scala. |
| [Consola](CLI/Consola/) | Comandos de terminal (bash/zsh), scripting y utilidades para entornos Big Data. |
| [Hadoop](Frameworks/Hadoop/) | Configuración de HDFS, ejecución de jobs MapReduce y tuning de clúster. |
| [Hive](Frameworks/Hive/) | Sintaxis de HiveQL, gestión de tablas, particionado y optimización de consultas. |
| [Spark](Frameworks/Spark/) | Conceptos de RDDs, DataFrames, Spark SQL y desarrollo de aplicaciones distribuidas. |
| [Cloudera](Distribuciones/Cloudera/) | Guías de instalación y gestión de Cloudera Manager y CDH. |
| [SQL-Server](BasesDeDatos/SQL-Server/) | Administración de instancias, T-SQL avanzado e integración con entornos Big Data. |
| [Arquitecturas-Big-Data](Conceptos/Arquitecturas-Big-Data/) | Arquitecturas Lambda/Kappa, procesamiento batch vs streaming, ETL/ELT y patrones de ingesta. |