Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/devlucho/spark-procesamiento-en-batch
Este proyecto utiliza PySpark para analizar datos de estudiantes a partir de un archivo CSV almacenado en HDFS.
https://github.com/devlucho/spark-procesamiento-en-batch
apache-spark hadoop-hdfs pyspark python3
Last synced: 17 days ago
JSON representation
Este proyecto utiliza PySpark para analizar datos de estudiantes a partir de un archivo CSV almacenado en HDFS.
- Host: GitHub
- URL: https://github.com/devlucho/spark-procesamiento-en-batch
- Owner: DevLucho
- Created: 2024-10-29T22:15:21.000Z (19 days ago)
- Default Branch: main
- Last Pushed: 2024-10-29T22:36:54.000Z (19 days ago)
- Last Synced: 2024-10-30T00:44:34.893Z (19 days ago)
- Topics: apache-spark, hadoop-hdfs, pyspark, python3
- Language: Python
- Homepage:
- Size: 93.8 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0