https://github.com/huemulsolutions/huemul-bigdatagovernance
Huemul BigDataGovernance, es una framework que trabaja sobre Spark, Hive y HDFS. Permite la implementación de una estrategia corporativa de dato único, basada en buenas prácticas de Gobierno de Datos. Permite implementar tablas con control de Primary Key y Foreing Key al insertar y actualizar datos utilizando la librería, Validación de nulos, largos de textos, máximos/mínimos de números y fechas, valores únicos y valores por default. También permite clasificar los campos en aplicabilidad de derechos ARCO para facilitar la implementación de leyes de protección de datos tipo GDPR, identificar los niveles de seguridad y si se está aplicando algún tipo de encriptación. Adicionalmente permite agregar reglas de validación más complejas sobre la misma tabla.
https://github.com/huemulsolutions/huemul-bigdatagovernance
bigdata chile cloudera data data-engineer data-engineering data-governance data-warehouse datamart dataquality gdpr hadoop hive hortonworks huemul huemul-bigdatagovernance parquet spark spark-sql trabaja-sobre-spark
Last synced: 7 months ago
JSON representation
Huemul BigDataGovernance, es una framework que trabaja sobre Spark, Hive y HDFS. Permite la implementación de una estrategia corporativa de dato único, basada en buenas prácticas de Gobierno de Datos. Permite implementar tablas con control de Primary Key y Foreing Key al insertar y actualizar datos utilizando la librería, Validación de nulos, largos de textos, máximos/mínimos de números y fechas, valores únicos y valores por default. También permite clasificar los campos en aplicabilidad de derechos ARCO para facilitar la implementación de leyes de protección de datos tipo GDPR, identificar los niveles de seguridad y si se está aplicando algún tipo de encriptación. Adicionalmente permite agregar reglas de validación más complejas sobre la misma tabla.
- Host: GitHub
- URL: https://github.com/huemulsolutions/huemul-bigdatagovernance
- Owner: HuemulSolutions
- License: apache-2.0
- Created: 2018-08-06T02:35:00.000Z (over 7 years ago)
- Default Branch: master
- Last Pushed: 2023-04-21T20:45:01.000Z (over 2 years ago)
- Last Synced: 2025-04-26T07:57:30.046Z (7 months ago)
- Topics: bigdata, chile, cloudera, data, data-engineer, data-engineering, data-governance, data-warehouse, datamart, dataquality, gdpr, hadoop, hive, hortonworks, huemul, huemul-bigdatagovernance, parquet, spark, spark-sql, trabaja-sobre-spark
- Language: Scala
- Homepage:
- Size: 1.27 MB
- Stars: 11
- Watchers: 3
- Forks: 7
- Open Issues: 23
-
Metadata Files:
- Readme: README.md
- License: LICENSE
- Code of conduct: CODE_OF_CONDUCT.md