Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/emso-exe/comercio_eletronico_brasileiro
Projeto de análise de dados do comércio eletrônico brasileiro disponibilizado pela Olist via plataforma Kaggle.
https://github.com/emso-exe/comercio_eletronico_brasileiro
analise-de-dados ciencia-de-dados data-analytics data-science datascience e-commerce postgres postgresql pyspark python python-3 python3 spark spark-sql sql
Last synced: 25 days ago
JSON representation
Projeto de análise de dados do comércio eletrônico brasileiro disponibilizado pela Olist via plataforma Kaggle.
- Host: GitHub
- URL: https://github.com/emso-exe/comercio_eletronico_brasileiro
- Owner: emso-exe
- License: mit
- Created: 2022-09-17T04:22:25.000Z (over 2 years ago)
- Default Branch: main
- Last Pushed: 2023-12-07T14:22:30.000Z (about 1 year ago)
- Last Synced: 2024-11-15T21:17:06.752Z (3 months ago)
- Topics: analise-de-dados, ciencia-de-dados, data-analytics, data-science, datascience, e-commerce, postgres, postgresql, pyspark, python, python-3, python3, spark, spark-sql, sql
- Language: Jupyter Notebook
- Homepage:
- Size: 41.5 MB
- Stars: 2
- Watchers: 2
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE.md
Awesome Lists containing this project
README
# 🔎 Análise de dados: Comércio eletrônico brasileiro 💳
Este é um projeto de análise do conjunto de dados públicos de comércio eletrônico brasileiro disponibilizados pelo site [Olist](https://olist.com/pt-br/) via plataforma [Kaggle](https://www.kaggle.com/datasets/olistbr/brazilian-ecommerce), são registros de vendas, valores, geolocalização, cadastros, entre outros que abrangem todo um processo venda de um produto por via on-line, são dados reais, entretanto, conforme informado pelos publicadores do dataset, os dados foram anonimizados, sendo que, por exemplo, os nomes das empresas foram subistituídos pelas grandes casas da série Game of Thrones.
## 📃 Demanda da análise
- Replicar os datasets para um banco de dados SQL
- Executar a exploração dos dados via SQL
- Aplicar ETL nas tabelas via PySpark
- Exportar dados para construção de uma apresentação## ❓ Indagações a serem respondidas pela análise exploratória dos dados
01. Qual o total(quantidade) de vendas divididas por estado?
02. Qual o total(valor) de vendas e fretes divididos por estado?
03. Qual o total(quantidade) e distribuição(%) de vendas por hora?
04. Qual a média(valor) de vendas por hora?
05. Qual o ticket médio nos anos de 2016, 2017 e 2018?
06. Qual a distribuição(%) da pontuação do pedidos?
07. Quais as 10 cidades com as maiores volumes(quantidade) de vendas?
08. Quais as 10 cidades com os maiores volumes(valores) de vendas e fretes?
09. Qual a quantidade de produtos cadastrados por categoria?
10. Qual a quantidade e distribuição(%) das categorias nos pedidos?
11. Qual a quantidade de vendas por vendedor?## 💻 Tecnologias
- PostgreSQL
- PySpark
## 💳 Créditos- [Estênio Mariano](https://github.com/emso-exe)
## 🔖 Licença
Licença MIT (MIT). Por favor leia o [arquivo da licença](LICENSE.md) para mais informações.