{"id":15157779,"url":"https://github.com/RickContreras/StudentPerformancePredictionSaberPro","last_synced_at":"2025-10-24T14:31:11.701Z","repository":{"id":254187107,"uuid":"845642545","full_name":"RickContreras/Modelos1","owner":"RickContreras","description":"Modelo de clasificación para predecir el desempeño de estudiantes en las Pruebas Saber Pro en Colombia. Incluye análisis exploratorio de datos, preprocesamiento y modelos de machine learning.","archived":false,"fork":false,"pushed_at":"2024-11-24T03:34:58.000Z","size":1756,"stargazers_count":1,"open_issues_count":0,"forks_count":3,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-01-31T02:02:09.632Z","etag":null,"topics":["classification","colombia","data-analysis","data-science","education","educational-assessment","exploratory-data-analysis","jupyter-notebook","machine-learning","python","saber-pro","scikit-learn","student-performance"],"latest_commit_sha":null,"homepage":"https://www.kaggle.com/competitions/udea-ai4eng-20242","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/RickContreras.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":null,"code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2024-08-21T16:35:10.000Z","updated_at":"2024-11-24T03:35:01.000Z","dependencies_parsed_at":"2024-08-29T18:09:57.714Z","dependency_job_id":null,"html_url":"https://github.com/RickContreras/Modelos1","commit_stats":null,"previous_names":["rickcontreras/modelos1"],"tags_count":0,"template":false,"template_full_name":null,"repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/RickContreras%2FModelos1","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/RickContreras%2FModelos1/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/RickContreras%2FModelos1/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/RickContreras%2FModelos1/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/RickContreras","download_url":"https://codeload.github.com/RickContreras/Modelos1/tar.gz/refs/heads/main","host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":237982288,"owners_count":19397235,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2022-07-04T15:15:14.044Z","host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["classification","colombia","data-analysis","data-science","education","educational-assessment","exploratory-data-analysis","jupyter-notebook","machine-learning","python","saber-pro","scikit-learn","student-performance"],"created_at":"2024-09-26T20:03:36.415Z","updated_at":"2025-10-24T14:31:11.689Z","avatar_url":"https://github.com/RickContreras.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# 📊 Modelos1 - Pruebas Saber Pro\n\n[![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT)\n![Python Version](https://img.shields.io/badge/python-3.12.5-blue.svg)\n![Jupyter Notebook](https://img.shields.io/badge/Jupyter-Notebook-orange)\n![scikit-learn](https://img.shields.io/badge/scikit--learn-v1.5.1-blue)\n![pandas](https://img.shields.io/badge/pandas-v2.2.2-blue)\n![numpy](https://img.shields.io/badge/numpy-v2.1.0-blue)\n\n\n¡Bienvenido al repositorio del curso de **Modelos 1** de la Universidad de Antioquia! 🎓 Aquí encontrarás todo lo relacionado con nuestro proyecto sobre las **Pruebas Saber Pro** en Colombia.\n\n# Tabla de Contenido\n- [👥 Participantes](#-participantes)\n- [📹 Videos de Entrega](#-videos-de-entrega)\n- [📋 Overview](#-overview)\n- [📊 Descripción del Conjunto de Datos](#-descripción-del-conjunto-de-datos)\n- [📈 Evaluación](#-evaluación)\n- [📁 Formato del Archivo de Envío](#-formato-del-archivo-de-envío)\n- [🗂️ Estructura del Proyecto](#️-estructura-del-proyecto)\n- [🔖 Citation](#-citation)\n\n\n## 👥 Participantes\n\n- **Nombre:** Ricardo Contreras\n\n- **Nombre:** Estiven Ospina González\n\n- **Nombre:** Daniel León\n\n## 📹 Videos de Entrega\n\n- **Entrega 2**: \u003ca href=\"https://youtu.be/Lfo4AFsae6A?si=8ObGC-U9c6mgJhSp\" target=\"_blank\"\u003ehttps://youtu.be/Lfo4AFsae6A?si=8ObGC-U9c6mgJhSp\u003c/a\u003e\n- **Entrega 3**: \u003ca href=\"https://youtu.be/mk9bLfLd_zI\" target=\"_blank\"\u003ehttps://youtu.be/mk9bLfLd_zI\u003c/a\u003e\n\n## 📋 Overview\n\nLas **Pruebas Saber Pro** son exámenes estandarizados que se realizan en Colombia para evaluar la calidad y el nivel de conocimiento de los estudiantes de educación superior. Estas pruebas son una iniciativa del Gobierno de Colombia para monitorear y mejorar la calidad de la educación superior en el país.\n\nLas pruebas abarcan cinco componentes genéricos:\n\n- **Inglés**\n- **Lectura Crítica**\n- **Competencias Ciudadanas**\n- **Razonamiento Cuantitativo**\n- **Comunicación Escrita**\n\nNuestro objetivo es crear un modelo de clasificación que prediga el desempeño de cada estudiante en estas pruebas, categorizándolos en: **bajo**, **medio-bajo**, **medio-alto** o **alto**.\n\n## 📊 Descripción del Conjunto de Datos\n\nEl conjunto de datos incluye varias columnas que describen diferentes aspectos de cada estudiante, tales como:\n\n- **Información Socioeconómica**: Características como el estrato socioeconómico, la educación de los padres, etc.\n- **Información Académica**: Detalles como el programa de estudio del estudiante, entre otros.\n\nEn total, contamos con registros de casi **700,000 estudiantes**.\n\n## 📈 Evaluación\n\nEsta es una tarea de clasificación multi-clase con 4 categorías. La métrica de desempeño que utilizaremos será el **accuracy**, es decir, el porcentaje de predicciones correctas que realiza nuestro modelo.\n\n## 📁 Formato del Archivo de Envío\n\nPara cada ID en el archivo `test.csv`, debemos predecir el desempeño en la variable `RENDIMIENTO_GLOBAL`. El archivo de envío debe tener un encabezado y seguir el siguiente formato:\n\n```csv\n  ID,RENDIMIENTO_GLOBAL\n  550236,bajo\n  98545,alto\n  499179,medio-bajo\n```\n\nEs crucial que el archivo de envío contenga los mismos IDs que están en el test.csv, ya que estos son los estudiantes con los que se evaluará el rendimiento de nuestro modelo.\n\n## 🗂️ Estructura del Proyecto\n```bash\n  Modelos1/\n  ├── .devcontainer/\n  │   ├── devcontainer.json\n  ├── data/\n  │   ├── train.csv\n  │   ├── test.csv\n  ├── .gitignore\n  ├── 01 - exploración.ipynb\n  ├── 02 - preprocesado.ipynb\n  ├── 03 - modelo con preprocesado de tal forma y SVM.ipynb\n  ├── 04 - modelo con preprocesado de otra forma y Random Forest.ipynb\n  ├── 99 - modelo solución.ipynb\n  ├── requirements.txt\n  ├── README.md\n```\n\n## 🔖 Citation\n\n- RLX. (2024). UDEA/ai4eng 20242 - Pruebas Saber Pro Colombia. Kaggle. https://kaggle.com/competitions/udea-ai4eng-20242\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2FRickContreras%2FStudentPerformancePredictionSaberPro","html_url":"https://awesome.ecosyste.ms/projects/github.com%2FRickContreras%2FStudentPerformancePredictionSaberPro","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2FRickContreras%2FStudentPerformancePredictionSaberPro/lists"}