https://github.com/datalopes1/bank_marketing
Este projeto será baseado no Dataset Bank Marketing encontrado na UC Irvine - Machine Learning Repository e disponibilizado por S. Moro, R. Laureano e P. Cortez
https://github.com/datalopes1/bank_marketing
data-analysis data-science data-visualization eda python
Last synced: about 2 months ago
JSON representation
Este projeto será baseado no Dataset Bank Marketing encontrado na UC Irvine - Machine Learning Repository e disponibilizado por S. Moro, R. Laureano e P. Cortez
- Host: GitHub
- URL: https://github.com/datalopes1/bank_marketing
- Owner: datalopes1
- Created: 2024-04-22T18:05:50.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2024-04-22T20:59:39.000Z (about 1 year ago)
- Last Synced: 2025-02-02T13:32:16.952Z (4 months ago)
- Topics: data-analysis, data-science, data-visualization, eda, python
- Language: Jupyter Notebook
- Homepage: https://medium.com/@datalopes1/bank-marketing-uma-an%C3%A1lise-explorat%C3%B3ria-de-dados-640c97df2bdd
- Size: 2.7 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# 💸 Bank Marketing - Análise Exploratória de Dados
Este projeto será baseado no Dataset Bank Marketing encontrado na UC Irvine - Machine Learning Repository e disponibilizado por S. Moro, R. Laureano e P. Cortez, e pode ser encontrado neste [link](https://archive.ics.uci.edu/dataset/222/bank+marketing). Você encontra esse projeto também no [Medium](https://medium.com/@datalopes1/bank-marketing-uma-an%C3%A1lise-explorat%C3%B3ria-de-dados-640c97df2bdd)
### 🛠️ Ferramentas utilizadas
 ## 1.1. Os dados, o problema, e o objetivo
### Estrutura dos dados
Os dados são relacionados com campanhas direta de marketing de uma instituição bancária portugesa. A campanha de marketing foi baseada em ligações telefonicas, por vezes mais de uma para o memso cliente, para saber se o produto financeiro (termo de depósito bancário) seria aceito ou não.|Coluna|Descrição|
|-|-|
|age|Idade|
|job|Tipo de trabalho|
|marital|Estado civil|
|education|Nível de educação|
|default|Se deu prejuízo ao banco|
|balance|Média de balanço anual|
|housing|Se possui emprestimo imobiliário|
|loan|Se possui emprestimo bancário|
|contact|Tipo de contato (celular, ou telefone fixo)|
|day_of_week|Dia do contato|
|month|Mês do contato|
|duration|Duração das ligações em segundos|
|campaign|Número de contatos feitos|
|pdays|Número de dias desde que o cliente foi contato por uma campanha anterior (-1 significa que não foi contatado)|
|previous|Número de contatos antes dessa campanha, para este cliente|
|poutcome|Resultado da última campanha (falha, sucesso)|
|y|Se o cliente aceitou essa campanha|### O problema
Como recém chegado no time de dados, o gestor nos fez algumas solicitações a partir dos dados dessa campanha após requisição do time de marketing para otimizar as próximas campanhas:1. Entender o perfil dos clientes do banco e identificar características que influenciam a aceitação dos produtos oferecidos;
2. Avaliar a eficácia da campanha de marketing direto para depósitos a prazo, identificando os melhores canais de contato e o perfil do público-alvo mais receptivo.### O objetivo
Dessa forma com os dados em mãos, nosso objetivo será:
- Buscar a relação entre as variáveis, e como elas influenciam na aceitação dos produtos;
- Identificar o perfil dos clientes mais propensos a fechar negócios após as campanhas;
- Entender como e quais os fatores da campanha que influenciam na aceitação das ofertas;## 1.2. Importação das bibliotecas e carregamento dos dados
Importei as biblitoecas pandas, numpy, matplotlib, seaborn. E então carreguei o dados através do pd.read_csv()# 🧱 2. Entendendo os dados
Através dos métodos shape, head(), tail() e info() busquei entender a estrutura dos dados. E percebi a necessidade de tratar outliers e checar nulos e duplicatas.
# 🧹 3. Limpeza e manipulação dos dados
## 3.1. Conferindo nulos e duplicatas
O dataset não possuía dados nulos ou duplicados
## 3.2. Os outliers (ou dados extremos)
Após notar o desbalanceamento dos dados, fiz a remoção de outliers nas colunas 'balance', 'duration' e 'campaign'
# 🔍 4. Análise Exploratória de Dados
## 4.1. O perfil dos clientes
A grande massa dos clientes está entre 20 e 60 anos de idade.

Os clientes do banco em maior número estão em posições de trabalho operacionais e de gerenciamento. Outra parcela relevante está em posições de técnico e administrativas.

50% dos clientes do banco tem como nível de educação o segundo grau completo, somente cerca de 30% tem ensino superior. O restante está distribuido entre o nível primiário e não informado.

Entre os clientes do banco 60% são casados, o restante está distribuido entre solteiro e divorciados.

Existe um número baixíssimo de clientes inadimplentes junto ao banco, o que mostra potencial para novos emprestimos.


Mais da metade dos clientes possui financiamento de imóvel, pessoas sem este tipo de divida tem maior potencial para adquirir produtos do bancário.

Existe uma margem muito grande de pessoas sem um emprestimo contratado, o que aponta possível disponibilidade de crédito para contratar produtos bancários.
### Trabalho x Aceitação do Produto

Estudantes são os clientes com maior taxa de conversão, seguidos por aposentados, desempregados e pessoas em função de gerencia. Estudantes e desempregados tem uma capacidade de endividamento baixa, e podem no futuro se tornar inadimplentes.
### Idade x Aceitação do Produto
Consumidores mais velhos tem maior tendência de aceitar o produto bancário, especialmente aqueles entre 30 e 50 anos de idade.
### Estado Civil x Aceitação do Produto

Apesar do maior volume maior de aceitação do produto estar entre os clientes casados, a taxa de conversão é maior entre solteiros e divorciados.
### Escolaridade x Aceitação do Produto

A taxa de conversão é maior em indivudos com nível superior completo e com nível educacional desconhecido, o maior volume se divide em nível de superior e de ensino médio completo.
### Balanço x Aceitação do Produto
Maior balanço em conta indica maior espaço no orçamento para um investimento, é outro público que deve ser focado.
### Financiamento Imobiliário x Aceitação do Produto

A taxa de conversão sobre pessoas sem um financiamento imobiliário é o triplo das que tem, além do volume também ser maior.
### Emprestimos x Aceitação do Produto

Pessoas sem emprestimos, claramente, tem maior potencial para adquirir novos produtos financeiros.
### Algumas conclusões
#### O cliente mais inclinado a contratar o produto tem:- Entre 30 e 50 anos de idade;
- Maior balanço em conta;
- É solteiro ou divorciado;
- Não emprestimos ou financiamentos imobiliários ativos;
- Tem escolaridade de nível superior ou secundária;
- É estudante, aposentado ou está em cargos de gerencia;A partir desses pontos, o time de marketing tem uma segmentação parar criar campanhas direcionadas para estes públicos.
## 4.2. A campanha
É necessário fazer um tracking melhor dos meios de contato, o celular é a forma mais comum mas existe um grande volume desconhecido.



O maior volume é de 1 ou 2 contatos feitos, mais a frente vamos buscar saber a relação entre sucesso e o número de contatos.
### Meio de Contato x Aceitação da Campanha

A maior taxa de sucesso e volume de sucesso está nos contatos por celular.
### Mês do Contato x Aceitação da Campanha

Os meses com as maiores taxas de sucesso em conversão são dezembro, março, outubro e setembro. A época de fim de ano parece propicia para campanhas direcionadas. Podemos pensar isso também em campanhas segmentadas para os públicos com maior porcentagem de sucesso na contratação do produto.
### Duração das Ligações x Aceitação da Campanha
Ligações que passam de 3 minutos tem maior chance de terminar uma contratação.
### Número de Contatos x Aceitação da Campanha

### Alguns insights sobre a campanha
- É necessário treinar a equipe para melhorar o convencimento na primeira ligação. Focar nos grupos mais suscetíveis ao aceite do produto, poderá trazer melhores resultados;
- O tempo de ligação também é um fator, romper a barreira dos 3 minutos traz maior probabilidade de fechamento;
- Os meses de março, setembro, outubro e dezembro são onde se tem maior taxa de conversão, campanhas bem segmentadas combinadas com essas datas podem trazer bons resultados.# ✅ 5. Conclusões

Ao fim foi possível traçar um perfil de clientes em potencial para contratação de serviços do banco, além de buscar entender fatores que possam aumentar a efetividade das próximas campanhas. Entender o comportamento dos consumidores e o seu perfil é essencial para auxiliar o marketing a otimizar seus resultados e diminuir seus custos, além de naturalmente aumentar os resultados comerciais.