https://github.com/emso-exe/churn_clientes_de_banco
Projeto de análise de churn, utilizando machine learning na classificação de dados de clientes que poderão ou não efetuar o encerramento de conta bancária.
https://github.com/emso-exe/churn_clientes_de_banco
analise-de-dados ciencia-de-dados data-analytics data-science dataanalytics kaggle kaggle-dataset machine-learning machinelearning python python-3 python3
Last synced: 9 months ago
JSON representation
Projeto de análise de churn, utilizando machine learning na classificação de dados de clientes que poderão ou não efetuar o encerramento de conta bancária.
- Host: GitHub
- URL: https://github.com/emso-exe/churn_clientes_de_banco
- Owner: emso-exe
- License: mit
- Created: 2023-02-12T04:09:57.000Z (over 3 years ago)
- Default Branch: main
- Last Pushed: 2023-09-22T21:25:21.000Z (over 2 years ago)
- Last Synced: 2025-09-08T22:46:35.759Z (9 months ago)
- Topics: analise-de-dados, ciencia-de-dados, data-analytics, data-science, dataanalytics, kaggle, kaggle-dataset, machine-learning, machinelearning, python, python-3, python3
- Language: Jupyter Notebook
- Homepage:
- Size: 7.72 MB
- Stars: 2
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE.md
Awesome Lists containing this project
README
# 🔎 Análise e classificação de Churn de clientes de banco 😒
Projeto de machine learning para análise de dados e classificação de clientes que potencialmente poderão encerrar suas contas em um banco, os dados estão disponíveis na plataforma [Kaggle](https://www.kaggle.com/datasets/shrutimechlearn/churn-modelling).
O problema a ser solucionado consiste em utilizar os dados bancários dos clientes que efetuaram ou não o encerramento de suas contas para criar um modelo preditivo que irá identificar possíveis clientes que poderão ou não deixar a instituição bancária, podendo assim determinar a taxa de churn (rotatividade/perda de clientes) e com base nos perfis mapeados tomar ações para retenção dos mesmos, evitando impactos como, por exemplo, aumento de custos, queda de lucro, reputação da marca entre outros fatores sensíveis a experiência do cliente com o produto da empresa.
## 📃 Demanda da análise
- Analisar a correlação dos dados dos clientes.
- Gerar um modelo preditivo de churn de clientes.
## 📋 Tópicos da análise
1. Análise das medidas estatísticas dos dados
2. Distribuição dos valores da váriavel dependente (target)
3. Distribuição dos dados entre as variáveis independentes (features) e dependente (target)
4. Correlação entre as variáveis
5. Preparação dos dados para aplicação no modelo preditivo
6. Separação (treino e teste), padronização e balanceamento dos dados
7. Modelo preditivo: Regressão Logística
1. Busca pelos melhores parâmetros e treinamento do modelo
2. Treinamento e predições do modelo
3. Métricas de avaliação do modelo
8. Modelo preditivo: Decision Tree
1. Busca pelos melhores parâmetros e treinamento do modelo
2. Treinamento e predições do modelo
3. Métricas de avaliação do modelo
9. Modelo preditivo: Random Forest
1. Busca pelos melhores parâmetros e treinamento do modelo
2. Treinamento e predições do modelo
3. Métricas de avaliação do modelo
10. Modelo preditivo: SVM (Support Vector Machine)
1. Busca pelos melhores parâmetros e treinamento do modelo
2. Treinamento e predições do modelo
3. Métricas de avaliação do modelo
11. Comparativo gráfico e de métricas
12. Conclusão
## 📓 Dicionário de dados
**RowNumber:** Números de linha de 1 a 10.000
**CustomerId:** Ids exclusivos para identificação do cliente do banco
**Surname:** Sobrenome do cliente
**CreditScore:** Score do cliente
**Geography:** País onde o cliente reside
**Gender:** Gênero, masculino ou feminino
**Age:** Idade do cliente
**Tenure:** Número de anos que o cliente está no banco
**Balance:** Saldo bancário do cliente
**NumOfProducts:** Número de produtos bancários que o cliente está utilizando
**HasCrCard:** Flag para saber se o cliente possui um cartão de crédito com o banco ou não
**IsActiveMember:** Flag para saber se o cliente é um membro ativo do banco ou não
**EstimatedSalary:** Salário estimado do cliente em dólares
**Exited:** Flag, 1 se o cliente encerrou a conta no banco e 0 se o cliente permaneceu
## 💻 Tecnologias
- Python
- Biblioteca GC
- Biblioteca Pandas
- Biblioteca Matplotlib
- Biblioteca Seaborn
- Biblioteca Numpy
- Biblioteca Warnings
- Biblioteca Tabulate
- Biblioteca SciKit-learn
- Biblioteca Imbalanced-learn
## 💳 Créditos
- [Estênio Mariano](https://github.com/emso-exe)
## 🔖 Licença
Licença MIT (MIT). Por favor leia o [arquivo da licença](LICENSE.md) para mais informações.