Ecosyste.ms: Awesome
An open API service indexing awesome lists of open source software.
https://github.com/aranzadata/betabankml
Modelo predictivo de aprendizaje supervisado para detectar clientes en riesgo de cancelar cuenta en Beta Bank.
https://github.com/aranzadata/betabankml
auc-roc-curve auc-roc-score f1-score sklearn supervised-learning
Last synced: 13 days ago
JSON representation
Modelo predictivo de aprendizaje supervisado para detectar clientes en riesgo de cancelar cuenta en Beta Bank.
- Host: GitHub
- URL: https://github.com/aranzadata/betabankml
- Owner: aranzadata
- Created: 2024-07-23T05:03:39.000Z (5 months ago)
- Default Branch: main
- Last Pushed: 2024-10-18T21:25:26.000Z (3 months ago)
- Last Synced: 2024-11-03T04:02:52.664Z (2 months ago)
- Topics: auc-roc-curve, auc-roc-score, f1-score, sklearn, supervised-learning
- Language: Jupyter Notebook
- Homepage:
- Size: 384 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
Este es un modelo predictivo de aprendizaje supervisado para detectar clientes de Beta Bank en riesgo de cancelar sus cuentas.
Se examina una base de datos de clientes actuales o pasados que contiene identificador de cliente, apellido, edad, género, país, balance, número de productos,
score crediticio, salario estimado, si tiene una tarjeta de crédito, si es cliente activo y si ha cancelado su cuenta.
Esta base de datos se segmenta para entrenamiento, validación y prueba.
Se consideran tres modelos: Regresión Logística, Árbol de Decisión y Bosque Aleatorio.
Para cada modelo se realizan codificación, estandarización y escalado de datos.
Posteriormente se hace una exploración para optimizar los hiperparámetrs sin considerar el desequilibrio de clases.
Se mejoran los modelos utilizando diferentes enfoques para corregir el desequilibrio.
Se calculan y comparan el valor F1 y la métrica AUC-ROC para cada modelo y se elige el modelo final en base a las mejores métricas.Para el modelo final se optó por el modelo de Bosque Aleatorio, con 100 estimadores y profundidad máxima de 8. Se utiliza codificación de etiquetas y corrección con sobremuestreo con 3 repeticiones. El puntaje final f1 es de 0.614 y el AUC ROC de 0.853.