https://github.com/dg2c4/bank-marketing-big-data
Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).
https://github.com/dg2c4/bank-marketing-big-data
dataset-csv excel google-colab-notebook ipynb-jupyter-notebook ipython-notebook jupiter-notebook overleaf python python-script
Last synced: 6 months ago
JSON representation
Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).
- Host: GitHub
- URL: https://github.com/dg2c4/bank-marketing-big-data
- Owner: dg2c4
- Created: 2025-04-26T17:05:30.000Z (6 months ago)
- Default Branch: main
- Last Pushed: 2025-04-26T20:06:09.000Z (6 months ago)
- Last Synced: 2025-04-30T06:48:25.494Z (6 months ago)
- Topics: dataset-csv, excel, google-colab-notebook, ipynb-jupyter-notebook, ipython-notebook, jupiter-notebook, overleaf, python, python-script
- Language: Jupyter Notebook
- Homepage:
- Size: 4.93 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Bank-Marketing-Big-Data
## *Objetivo:*
Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).
El trabajo se divide en tres componentes principales:
### *1. Análisis Exploratorio:*
- Formulación de preguntas de investigación.
- Creación de hipótesis basadas en un problema específico.
- Análisis inicial del conjunto de datos seleccionado.
### *2. Preprocesamiento de Datos:*
- Limpieza de datos.
- Transformación de variables.
- Reducción de datos cuando sea necesario.
- Discretización de datos según corresponda.
### *3. Modelado y Evaluación:*
- Implementación de modelo de regresión lineal o logística
- Selección y cálculo de métricas de evaluación
- Análisis del rendimiento del modelo
## *Conjunto de datos:*
Contiene datos sobre campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa.
https://archive.ics.uci.edu/dataset/222/bank+marketing
## *Ejercicio:*
A. Realizar un análisis exploratorio al conjunto de datos entregado, para ello debe crear diferentes preguntas e hipótesis a resolver en los datos partiendo de un problema que cada grupo debe plantear.\
B. Después de realizar el análisis exploratorio, debe hacer el preprocesamiento de los datos según como considere: limpieza, transformación, reducción de datos o discretización de los datos.\
C. Debe realizar un entrenamiento del modelo de machine learning.
### *Algunos algoritmos de clustering:*
· K-Means-Clustering.\
· DBSCAN (Density-Based Spatial Clustering of Applications with Noise).\
· Hierarchical Clustering.\
· Gaussian Mixture Model (GMM).\
· Principal Component Analysis (PCA).
## *Evaluación:*
| Ítem | Puntos |
|------|--------|
| Análisis exploratorio de los datos y uso de algoritmos de cluster | 20 pts |
| Efectividad del modelo (Mínimo 70%) | 10 pts |
| Entrenamiento | 10 pts |
| Justificación | 10 pts |
|Total | 50 pts |
## *Systems engineering:*
| User: | David Gutierrez Chaves |
|------|--------|
| Code: | 506222728 |
| Subject: | Big Data Electiva-I |
| Institution: | Fundación Universitaria Konrad Lorenz |
| Institutional email | david.gutierrec@konradlorenz.edu.co |
## Created By:
https://github.com/dg2c4
### *Date:* 05/04/2025 - 26/04/2025