https://github.com/caritoramos/predictive-classification-model-in-python
This project applies Machine Learning classification models to predict customer acceptance of marketing offers using Python and libraries such as Pandas, NumPy, Scikit-learn, and XGBoost.
https://github.com/caritoramos/predictive-classification-model-in-python
classification-algorithm data-science decision-tree-classifier logistic-regression machine-learning random-forest
Last synced: about 2 months ago
JSON representation
This project applies Machine Learning classification models to predict customer acceptance of marketing offers using Python and libraries such as Pandas, NumPy, Scikit-learn, and XGBoost.
- Host: GitHub
- URL: https://github.com/caritoramos/predictive-classification-model-in-python
- Owner: CaritoRamos
- Created: 2024-02-29T21:34:17.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2025-03-31T01:54:42.000Z (about 2 months ago)
- Last Synced: 2025-03-31T02:33:48.603Z (about 2 months ago)
- Topics: classification-algorithm, data-science, decision-tree-classifier, logistic-regression, machine-learning, random-forest
- Language: Jupyter Notebook
- Homepage:
- Size: 8.68 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# 📊 **Modelo Supervisado de Clasificación: Aceptación de Clientes a Ofertas en Campañas de Marketing**
Este proyecto aplica técnicas de Machine Learning para predecir la aceptación de clientes a ofertas en campañas de marketing.
A través del análisis predictivo, permite a las empresas anticipar el comportamiento de los clientes y optimizar sus estrategias comerciales.## 🔍 **Estructura del Proyecto**
### 1️⃣ **Entendimiento de los Datos (Data Understanding)**
- Análisis inicial del dataset.
- Revisión de tipos de datos, valores nulos y distribución de variables.
- Identificación de posibles sesgos o desbalance de clases.### 2️⃣ **Preparación de los Datos (Data Preparation)**
- Manejo de valores faltantes y outliers.
- Creación de nuevas variables relevantes.
- Codificación de variables categóricas.
- Normalización y escalado de variables numéricas.
- División del dataset en entrenamiento (70%), validación (15%) y prueba (15%).### 3️⃣ **Análisis Exploratorio de Datos (EDA)**
- Visualización de distribuciones de variables.
- Análisis de correlaciones entre características.
- Detección de patrones relevantes en los datos.### 4️⃣ **Modelado (Modelling)**
- Selección de algoritmos de clasificación supervisada:
- Regresión logística.
- Random Forest.
- XGBoost.
- Ajuste de hiperparámetros y validación cruzada.
- Evaluación del desempeño con métricas como precisión, recall, F1-score y matriz de confusión.### 5️⃣ **Interpretación de Resultados y Conclusiones**
- Comparación de modelos y selección del mejor enfoque.
- Identificación de variables más influyentes en la predicción.
- Recomendaciones para la aplicación del modelo en estrategias de marketing.## 🛠 **Tecnologías Utilizadas**
- **Lenguaje**: Python
- **Librerías**: Pandas, NumPy, Scikit-learn, Matplotlib, Seaborn, XGBoost
- **Herramientas**: Jupyter Notebook, Google Colab