An open API service indexing awesome lists of open source software.

https://github.com/dg2c4/bank-marketing-big-data

Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).
https://github.com/dg2c4/bank-marketing-big-data

dataset-csv excel google-colab-notebook ipynb-jupyter-notebook ipython-notebook jupiter-notebook overleaf python python-script

Last synced: 6 months ago
JSON representation

Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).

Awesome Lists containing this project

README

          

# Bank-Marketing-Big-Data


Bank-Marketing-Data-Illustration

## *Objetivo:*
Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).
El trabajo se divide en tres componentes principales:

### *1. Análisis Exploratorio:*
- Formulación de preguntas de investigación.
- Creación de hipótesis basadas en un problema específico.
- Análisis inicial del conjunto de datos seleccionado.

### *2. Preprocesamiento de Datos:*
- Limpieza de datos.
- Transformación de variables.
- Reducción de datos cuando sea necesario.
- Discretización de datos según corresponda.

### *3. Modelado y Evaluación:*
- Implementación de modelo de regresión lineal o logística
- Selección y cálculo de métricas de evaluación
- Análisis del rendimiento del modelo

## *Conjunto de datos:*
Contiene datos sobre campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa.

https://archive.ics.uci.edu/dataset/222/bank+marketing

## *Ejercicio:*
A. Realizar un análisis exploratorio al conjunto de datos entregado, para ello debe crear diferentes preguntas e hipótesis a resolver en los datos partiendo de un problema que cada grupo debe plantear.\
B. Después de realizar el análisis exploratorio, debe hacer el preprocesamiento de los datos según como considere: limpieza, transformación, reducción de datos o discretización de los datos.\
C. Debe realizar un entrenamiento del modelo de machine learning.

### *Algunos algoritmos de clustering:*
· K-Means-Clustering.\
· DBSCAN (Density-Based Spatial Clustering of Applications with Noise).\
· Hierarchical Clustering.\
· Gaussian Mixture Model (GMM).\
· Principal Component Analysis (PCA).

## *Evaluación:*
| Ítem | Puntos |
|------|--------|
| Análisis exploratorio de los datos y uso de algoritmos de cluster | 20 pts |
| Efectividad del modelo (Mínimo 70%) | 10 pts |
| Entrenamiento | 10 pts |
| Justificación | 10 pts |
|Total | 50 pts |

## *Systems engineering:*
| User: | David Gutierrez Chaves |
|------|--------|
| Code: | 506222728 |
| Subject: | Big Data Electiva-I |
| Institution: | Fundación Universitaria Konrad Lorenz |
| Institutional email | david.gutierrec@konradlorenz.edu.co |

## Created By:
https://github.com/dg2c4

### *Date:* 05/04/2025 - 26/04/2025