https://github.com/dg2c4/bank-marketing-big-data

Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).
https://github.com/dg2c4/bank-marketing-big-data

dataset-csv excel google-colab-notebook ipynb-jupyter-notebook ipython-notebook jupiter-notebook overleaf python python-script

Last synced: 6 months ago
JSON representation

Host: GitHub
URL: https://github.com/dg2c4/bank-marketing-big-data
Owner: dg2c4
Created: 2025-04-26T17:05:30.000Z (6 months ago)
Default Branch: main
Last Pushed: 2025-04-26T20:06:09.000Z (6 months ago)
Last Synced: 2025-04-30T06:48:25.494Z (6 months ago)
Topics: dataset-csv, excel, google-colab-notebook, ipynb-jupyter-notebook, ipython-notebook, jupiter-notebook, overleaf, python, python-script
Language: Jupyter Notebook
Homepage:
Size: 4.93 MB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md

Awesome Lists containing this project

README

# Bank-Marketing-Big-Data

Bank-Marketing-Data-Illustration

## *Objetivo:*
Los datos se relacionan con campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa. El objetivo de la clasificación es predecir si el cliente suscribirá un depósito a plazo (variable y).
El trabajo se divide en tres componentes principales:

### *1. Análisis Exploratorio:*
- Formulación de preguntas de investigación.
- Creación de hipótesis basadas en un problema específico.
- Análisis inicial del conjunto de datos seleccionado.

### *2. Preprocesamiento de Datos:*
- Limpieza de datos.
- Transformación de variables.
- Reducción de datos cuando sea necesario.
- Discretización de datos según corresponda.

### *3. Modelado y Evaluación:*
- Implementación de modelo de regresión lineal o logística
- Selección y cálculo de métricas de evaluación
- Análisis del rendimiento del modelo

## *Conjunto de datos:*
Contiene datos sobre campañas de marketing directo (llamadas telefónicas) de una entidad bancaria portuguesa.

https://archive.ics.uci.edu/dataset/222/bank+marketing

## *Ejercicio:*
A. Realizar un análisis exploratorio al conjunto de datos entregado, para ello debe crear diferentes preguntas e hipótesis a resolver en los datos partiendo de un problema que cada grupo debe plantear.\
B. Después de realizar el análisis exploratorio, debe hacer el preprocesamiento de los datos según como considere: limpieza, transformación, reducción de datos o discretización de los datos.\
C. Debe realizar un entrenamiento del modelo de machine learning.

### *Algunos algoritmos de clustering:*
· K-Means-Clustering.\
· DBSCAN (Density-Based Spatial Clustering of Applications with Noise).\
· Hierarchical Clustering.\
· Gaussian Mixture Model (GMM).\
· Principal Component Analysis (PCA).

## *Evaluación:*
| Ítem | Puntos |
|------|--------|
| Análisis exploratorio de los datos y uso de algoritmos de cluster | 20 pts |
| Efectividad del modelo (Mínimo 70%) | 10 pts |
| Entrenamiento | 10 pts |
| Justificación | 10 pts |
|Total | 50 pts |

## *Systems engineering:*
| User: | David Gutierrez Chaves |
|------|--------|
| Code: | 506222728 |
| Subject: | Big Data Electiva-I |
| Institution: | Fundación Universitaria Konrad Lorenz |
| Institutional email | david.gutierrec@konradlorenz.edu.co |

## Created By:
https://github.com/dg2c4

### *Date:* 05/04/2025 - 26/04/2025

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/dg2c4/bank-marketing-big-data

Awesome Lists containing this project

README