An open API service indexing awesome lists of open source software.

https://github.com/mpbeatriz/santander_coders_2024

Repositório dos exercícios e projetos do curso de Engenharia de Dados da Ada em parceria com o Santander (em andamento).
https://github.com/mpbeatriz/santander_coders_2024

apache-kafka apache-spark api data-engineering data-extraction fastapi flask numpy oop pandas python webhooks

Last synced: 2 months ago
JSON representation

Repositório dos exercícios e projetos do curso de Engenharia de Dados da Ada em parceria com o Santander (em andamento).

Awesome Lists containing this project

README

          

# Santander Coders 2024 - Engenharia de Dados

Repositório dos exercícios e projetos do curso de Engenharia de Dados da Ada em parceria com o Santander (em andamento).

Conteúdo didático do curso:
* Módulo I: Lógica de Programação em Python II
- Listas;
- Tuplas;
- Dicionários;
- Compreensão de listas;
- Expressões geradoras;
- Strings;
- Funções;
- Programação funcional;
- Tratamento de exceções;
- Arquivos.

* Módulo II: Programação Orientada a Objetos
- Paradigmas de programação;
- Classes e objetos;
- Módulos e pacotes;
- Atributos privados e métodos de acesso;
- Métodos mágicos;
- Atributos e métodos estáticos;
- Herança e polimorfismo.

* Módulo III: Técnicas de Programação em Python I
- Git e GitHub;
- NumPy;
- Pandas.

* Módulo IV: Extração de Dados I
- Databricks;
- ETL e ELT;
- APIs;
- Armazenamento de dados;
- Apache Spark;
- Arquitetura orientada a eventos;
- Apache Kafka.

* Módulo V: Analytics Engineering
- Boas Práticas Para Tratamento de Dados (Analytics);
- Data Quality, Data Clean e Testes;
- Validando dados com Great Expectations;
- Especializando dados através do dbt - data build tool.

* Módulo VI: Big Data
- Big Data;
- Apache Hadoop;
- Cloud computing;
- Databricks;
- Apache Hive;
- Spark;
- Delta Lake;
- Otimizações e Engenharia de Dados com Spark;
- Spark Streaming.