Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/emso-exe/comercio_eletronico_brasileiro

Projeto de análise de dados do comércio eletrônico brasileiro disponibilizado pela Olist via plataforma Kaggle.
https://github.com/emso-exe/comercio_eletronico_brasileiro

analise-de-dados ciencia-de-dados data-analytics data-science datascience e-commerce postgres postgresql pyspark python python-3 python3 spark spark-sql sql

Last synced: 25 days ago
JSON representation

Projeto de análise de dados do comércio eletrônico brasileiro disponibilizado pela Olist via plataforma Kaggle.

Awesome Lists containing this project

README

        

# 🔎 Análise de dados: Comércio eletrônico brasileiro 💳

Este é um projeto de análise do conjunto de dados públicos de comércio eletrônico brasileiro disponibilizados pelo site [Olist](https://olist.com/pt-br/) via plataforma [Kaggle](https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce), são registros de vendas, valores, geolocalização, cadastros, entre outros que abrangem todo um processo venda de um produto por via on-line, são dados reais, entretanto, conforme informado pelos publicadores do dataset, os dados foram anonimizados, sendo que, por exemplo, os nomes das empresas foram subistituídos pelas grandes casas da série Game of Thrones.

## 📃 Demanda da análise

- Replicar os datasets para um banco de dados SQL
- Executar a exploração dos dados via SQL
- Aplicar ETL nas tabelas via PySpark
- Exportar dados para construção de uma apresentação

## ❓ Indagações a serem respondidas pela análise exploratória dos dados

01. Qual o total(quantidade) de vendas divididas por estado?
02. Qual o total(valor) de vendas e fretes divididos por estado?
03. Qual o total(quantidade) e distribuição(%) de vendas por hora?
04. Qual a média(valor) de vendas por hora?
05. Qual o ticket médio nos anos de 2016, 2017 e 2018?
06. Qual a distribuição(%) da pontuação do pedidos?
07. Quais as 10 cidades com as maiores volumes(quantidade) de vendas?
08. Quais as 10 cidades com os maiores volumes(valores) de vendas e fretes?
09. Qual a quantidade de produtos cadastrados por categoria?
10. Qual a quantidade e distribuição(%) das categorias nos pedidos?
11. Qual a quantidade de vendas por vendedor?

## 💻 Tecnologias

- PostgreSQL
- PySpark

## 💳 Créditos

- [Estênio Mariano](https://github.com/emso-exe)

## 🔖 Licença

Licença MIT (MIT). Por favor leia o [arquivo da licença](LICENSE.md) para mais informações.