https://github.com/codeonthespectrum/telecom_ml
Terceiro desafio da Oracle ONE 8 + Alura
https://github.com/codeonthespectrum/telecom_ml
Last synced: 10 months ago
JSON representation
Terceiro desafio da Oracle ONE 8 + Alura
- Host: GitHub
- URL: https://github.com/codeonthespectrum/telecom_ml
- Owner: codeonthespectrum
- Created: 2025-07-27T14:11:30.000Z (11 months ago)
- Default Branch: main
- Last Pushed: 2025-07-27T14:26:09.000Z (11 months ago)
- Last Synced: 2025-07-27T16:27:45.466Z (11 months ago)
- Language: Jupyter Notebook
- Size: 1.06 MB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Telecom X - Utilizando Machine Learning - Alura Challenge
📡 **Análise Preditiva de Churn em Telecom - Challenge Data Science**
Este projeto realiza uma análise detalhada e constrói modelos de machine learning a partir dos dados da empresa Telecom X. O objetivo é identificar os principais fatores que levam ao cancelamento de serviços (churn) e criar um modelo preditivo para identificar clientes com risco de evasão, gerando insights para estratégias de retenção.
📌 **Objetivos**
* Analisar o perfil demográfico e contratual dos clientes para entender o churn.
* Identificar as variáveis mais importantes na previsão de cancelamento.
* Tratar o desbalanceamento de classes na variável-alvo (`churn`) utilizando a técnica SMOTE.
* Treinar e avaliar o desempenho de modelos de classificação (Random Forest e Regressão LogÃstica).
* Propor recomendações estratégicas e baseadas em dados para reduzir a taxa de churn.
🧪 **Tecnologias Utilizadas**
* Python
* Pandas e NumPy para manipulação e análise de dados
* Matplotlib e Seaborn para visualizações de dados
* Scikit-learn para pré-processamento, modelagem e avaliação
* Imbalanced-learn para balanceamento de classes (SMOTE)
* Requests para extração de dados
* Jupyter Notebook como ambiente de desenvolvimento
* Markdown para documentação e relatórios
📈 **Resultados Principais**
* **Contrato Mês a Mês e Baixo Tenure:** Confirmados pela análise de importância das features como os principais indicadores de churn.
* **Cheque Eletrônico e Valor Mensal Elevado:** Também se mostraram fatores de grande influência na decisão de cancelamento.
* **Desempenho do Modelo Preditivo:** O modelo de **Regressão LogÃstica** apresentou a melhor performance para o objetivo de negócio, alcançando um **recall de 78%** na identificação de clientes que cancelaram, superando o Random Forest neste critério crucial.
🔎 **Para detalhes completos, consulte o [Relatório de Análise de Evasão]**
📤 **Conclusão**
A análise e a modelagem preditiva identificaram um perfil claro do cliente com alto risco de churn: cliente novo, com contrato mensal, valor de conta elevado e que utiliza cheque eletrônico como forma de pagamento. A recomendação principal é focar os esforços de retenção nestes clientes, utilizando o modelo preditivo para identificá-los proativamente e oferecer incentivos para a migração para contratos de longo prazo.
📬 **Contato**
Para dúvidas ou sugestões, entre em contato:
* **Nome:** [Gabrielly Gomes]
* **Email:** [gabrielly.gomes@ufpi.edu.br]
📌 *Projeto desenvolvido com fins analÃticos e educacionais.*