Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/vitorm3/ecommerce-ed
Generalist E-Commerce model for testing data pipelines and projects best practices
https://github.com/vitorm3/ecommerce-ed
apache-airflow apache-spark astro-cli mkdocs python sql
Last synced: 3 months ago
JSON representation
Generalist E-Commerce model for testing data pipelines and projects best practices
- Host: GitHub
- URL: https://github.com/vitorm3/ecommerce-ed
- Owner: VitorM3
- License: mit
- Created: 2024-06-07T23:12:53.000Z (7 months ago)
- Default Branch: main
- Last Pushed: 2024-06-28T21:56:34.000Z (6 months ago)
- Last Synced: 2024-10-12T00:03:02.925Z (3 months ago)
- Topics: apache-airflow, apache-spark, astro-cli, mkdocs, python, sql
- Language: Python
- Homepage: https://vitorm3.github.io/Ecommerce-ED/
- Size: 7.27 MB
- Stars: 1
- Watchers: 2
- Forks: 2
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- Changelog: CHANGELOG.md
- Contributing: CONTRIBUTING.md
- License: LICENSE
- Code of conduct: CODE_OF_CONDUCT.md
- Security: SECURITY.md
Awesome Lists containing this project
README
# Ecommerce · [![License](https://img.shields.io/badge/License-MIT-blue.svg)](LICENSE) ![Release](https://img.shields.io/github/v/release/VitorM3/Ecommerce-ED) [![Deploy MkDocs to GitHub Pages](https://github.com/VitorM3/Ecommerce-ED/actions/workflows/deploy-mkdocs.yml/badge.svg)](https://github.com/VitorM3/Ecommerce-ED/actions/workflows/deploy-mkdocs.yml)
Um modelo genérico de E-commerce para validação de conhecimentos da matéria de Engenharia de Dados.
## Começando
Essas instruções permitirão que você obtenha uma cópia do projeto em operação na sua máquina local para fins de desenvolvimento e teste.
## Desenho de Arquitetura
![System Architecture](./assets/System_Architecture.png "Arquitetura do Sistema")
## Pré-requisitos
Para que o projeto funcione devidamente é necessário que seja instalado em um computador com as seguintes configurações:
```
Memoria Ram: 16gb
Processador: Intel Core i5 6gh ou superior
Espaço em disco: 6gb
```Além disto é necessário a prévia instalação e configuração do Docker:
https://docs.docker.com/engine/install/## Instalação
Para realizar a instalação, rode o comando
```bash
docker compose up
```
Este comando irá subir todos os containers que farão o processo funcionar devidamente## Implantação
Após instalado, será necessário a configuração das conexões do Apache Spark e do banco base PostgreSql. Esta configuração poderá ser feita dentro da aba de conexões do Apache Airflow, localizada em:
> admin > Connections
## Ferramentas utilizadas
# [![Postgres](https://img.shields.io/badge/PostgreSQL-316192?style=for-the-badge&logo=postgresql&logoColor=white)](https://www.postgresql.org/) [![Python](https://img.shields.io/badge/Python-3776AB?style=for-the-badge&logo=python&logoColor=white)](https://www.python.org/) [![Docker](https://img.shields.io/badge/Docker-2496ED?style=for-the-badge&logo=docker&logoColor=white)](https://www.docker.com/) [![Spark](https://img.shields.io/badge/Apache%20Spark-E25A1C?style=for-the-badge&logo=apache-spark&logoColor=white)](https://spark.apache.org/) [![AirFlow](https://img.shields.io/badge/Airflow-017CEE?style=for-the-badge&logo=Apache%20Airflow&logoColor=white)](https://airflow.apache.org/) [![Visual Studio Code](https://img.shields.io/badge/Visual_Studio_Code-0078D4?style=for-the-badge&logo=visual%20studio%20code&logoColor=white)](https://code.visualstudio.com/) [![Astro CLI](https://img.shields.io/badge/Astro%20CLI---?style=for-the-badge&color=%235468ff)](https://www.astronomer.io/docs/astro/cli/overview) [![MinIO](https://img.shields.io/badge/MinIO---?style=for-the-badge&logo=MinIO&color=rgb(199%2044%2072))](https://min.io/)
- **PostgreSQL** - Banco de dados relacional
- **Python** - Linguagem de programação utilizada para criar os scripts de extração, transformação e carga de dados
- **Docker** - Containerização de aplicações
- **Apache Spark** - Processamento de dados em larga escala
- **Apache Airflow** - Orquestrador de tarefas
- **Visual Studio Code** - Editor de código
- **Astro CLI** - Ferramenta de linha de comando para gerenciamento de infraestrutura
- **Minio** - Armazenamento de objetos## Colaboração
O principal intuíto deste projeto é a validação de conhecimentos adquiridos na matéria de Engenharia de Dados, por isso, a colaboração é essencial para o desenvolvimento do projeto.Leia abaixo como você pode colaborar com o projeto e ajudar compartilhando seu conhecimento e experiência.
### Código de Conduta
Nosso código de conduta é derivado do [Contributor Covenant](https://www.contributor-covenant.org/), versão 2.1, disponível em [CODE OF CONDUCT](CODE_OF_CONDUCT.md).### Guia de Colaboração
Leia o [CONTRIBUTING](CONTRIBUTING.md) para entender o processo de contribuição ao desenvolvimento do nosso projeto, auxiliando com possíveis bugfixes e melhorias.### Boas primeiras Issues
Para se familiarizar com o projeto, você pode começar verificando as issues com o rótulo "[good first issue](https://github.com/VitorM3/Ecommerce-ED/labels/good%20first%20issue)". Estas possuem bugs ou aprimoramentos mais simples de serem resolvidos, geralmente com escopos limitados e perfeito para quem está começando a contribuir com o nosso projeto.## Versão
O versionamento é feito com base na metodologia [SEMVER](https://semver.org/lang/pt-BR/). Explore as [tags neste repositório](https://github.com/VitorM3/Ecommerce-ED/tags) para ver todas as versões disponíveis e o [CHANGELOG.md](CHANGELOG.md) para saber mais sobre as alterações em cada versão.
## Autores
* **[Angelo José da Rosa](https://github.com/angelum23)** - *Orquestração*
* **[Danilo Formanski](https://github.com/danilean)** - *Documentação*
* **[João Victor Miotelli Vitali](https://github.com/JoaoMiotelli)** - *Orquestração*
* **[Lucas de Oliveira Alano](https://github.com/LucasAlano)** - *Orquestração*
* **[Vinicius Albino dos Santos](https://github.com/Shinguek0)** - *Data Visualization*
* **[Vitor Loch Mafei Rosa](https://github.com/VitorM3)** - *DBA*
* **[Vitor Loch Mafei Rosa](https://github.com/VitorLMR)** - *DBA*
* **[Vitor Minatto Barp](https://github.com/Minattoo)** - *Data Visualization*
* **[Yuri Lopes Machado](https://github.com/YuriLopesM)** - *Documentação*Você também pode ver a lista de todos os [colaboradores](COLABORATORS.md) que participaram deste projeto.
## Licença
Este projeto está sob a licença MIT - veja o arquivo [LICENSE](./LICENSE) para detalhes.
## Referências
* **[Documentação Apache Spark](https://spark.apache.org/docs/latest/)**
* **[Documentação Apache Airflow](https://airflow.apache.org/docs/)**
* **[Documentação Delta Lake](https://delta.io/)**
* **[Bíblia Sagrada](https://www.bibliaonline.com.br/)**