https://github.com/tomaslopera/casoclasificacion
https://github.com/tomaslopera/casoclasificacion
data-preparation data-transformation exploratory-data-analysis machine-learning visualization
Last synced: 9 months ago
JSON representation
- Host: GitHub
- URL: https://github.com/tomaslopera/casoclasificacion
- Owner: Tomaslopera
- Created: 2025-08-30T20:40:36.000Z (9 months ago)
- Default Branch: main
- Last Pushed: 2025-08-30T20:43:50.000Z (9 months ago)
- Last Synced: 2025-08-30T22:19:49.484Z (9 months ago)
- Topics: data-preparation, data-transformation, exploratory-data-analysis, machine-learning, visualization
- Language: Jupyter Notebook
- Homepage:
- Size: 2.05 MB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# Caso 8: Clasificación (Ciberseguridad)
## Contexto
Proyecto de detección de **intrusiones en transacciones** mediante modelos de clasificación binaria (Normal vs Ataque). El objetivo es alcanzar un **F1-score ≥ 80%** con una matriz de confusión que refleje un bajo número de falsos negativos. Se utiliza la metodología **ASUM-DM**
## Metodología
- **Exploración**: definición de variable **Y**, revisión de distribución de clases, variables categóricas y numéricas.
- **Preparación**: manejo de datos nulos, eliminación de variables innecesarias y manejo de desbalance.
- **Transformación**: construcción de pipeline mediante **MinMaxScaler()** para variables numéricas y **OneHotEncoder()** para variables categóricas.
- **Modelado**: entrenamiento y comparación de algoritmos (**Regresión Logística, Árboles, Random Forest, SVM, Gradient Boosting**) con validación cruzada.
- **Evaluación**: verificación de los modelos mediante matriz de confusión y reporte de confusión
## Tecnologías
- Python
- Pandas
- Scikit-learn
- Matplotlib, Seaborn
- Jupyter Notebook