Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/niel0503/simuladornivel2

Segundo proyecto realizado como parte de mi aprendizaje en el bootcamp de Télos
https://github.com/niel0503/simuladornivel2

Last synced: 3 days ago
JSON representation

Segundo proyecto realizado como parte de mi aprendizaje en el bootcamp de Télos

Awesome Lists containing this project

README

        



# 📊 Simulador Télos - Nivel 2
## Análisis de Datos con PySpark / Análise de dados com PySpark


¡Hola! Bienvenido a mi proyecto del segundo nivel del Bootcamp Télos. En este nivel, estoy utilizando PySpark para analizar grandes conjuntos de datos y extraer insights valiosos que pueden ayudar en la toma de decisiones estratégicas.

Olá! Bem-vindo ao meu projeto de segundo nível do Bootcamp Télos. Neste nível, estou usando o PySpark para analisar grandes conjuntos de dados e extrair insights valiosos que podem ajudar na tomada de decisões estratégicas.

## 🚀 Objetivo del Proyecto / Objetivo do Projeto

El objetivo de este proyecto es desarrollar una serie de análisis en un dataset de notas de alumnos utilizando PySpark. A través de este simulador, aplicaré técnicas de análisis de datos para proporcionar insights que podrían ser cruciales en la toma de decisiones educativas.

O objetivo deste projeto é desenvolver uma série de análises sobre um conjunto de dados de anotações de alunos utilizando PySpark. Através deste simulador, aplicarei técnicas de análise de dados para fornecer insights que poderão ser cruciais na tomada de decisões educacionais.

## 📝 Historias de Usuario / Histórias de usuários

### 1️⃣ Visualización y Análisis Inicial de los Datos / Visualização e análise inicial de dados

Como analista de datos, quiero tratar los datos enviados al sistema para padronizarlos, permitiéndome hacer un análisis futuro y entender la correlación entre cada variable y tipo de dato.

Como analista de dados, quero processar os dados enviados ao sistema para padronizá-los, permitindo-me fazer análises futuras e entender a correlação entre cada variável e tipo de dado.

--> Criterios de Aceptación / Critérios de Aceitação

Cargar el dataset y mostrar las primeras líneas y el esquema del DataFrame / Carregar o conjunto de dados e exiba as primeiras linhas e o contorno do DataFrame

Realizar un análisis descriptivo básico (media, mediana, desviaciones) / Realizar uma análise descritiva básica (média, mediana, desvios)

### 2️⃣ Limpieza y Preparación de los Datos / Limpeza e preparação de dados

Como analista de datos, necesito limpiar y preparar los datos, asegurándome de que estén listos para análisis más complejos.

Como analista de dados, preciso limpar e preparar os dados, garantindo que estejam prontos para análises mais complexas.

--> Criterios de Aceptación / Critérios de Aceitação

Identificar y tratar valores nulos / Identificar e lidar com valores nulos

Normalizar y formatear las columnas conforme sea necesario / Normalizar e formatar colunas conforme necessário

### 3️⃣ Análisis Avanzado: Relación entre Renta Familiar y Notas / Análise Avançada: Relação entre Renda Familiar e Notas

Como analista de datos, quiero explorar cómo la renta familiar influye en el desempeño de los alumnos.

Como analista de dados, quero explorar como a renda familiar influencia o desempenho dos alunos.

--> Criterios de Aceptación / Critérios de Aceitação

Agrupar los datos por renta familiar y calcular la media de las notas / Agrupar os dados por renda familiar e calcule a média das notas

Analizar si existe una correlación visible con otras variables como horas de estudio, clases particulares, o practicar deportes / Analisar se há correlação visível com outras variáveis ​​como horas de estudo, aulas particulares ou prática de esportes

### 4️⃣ Visualización de Datos / Visualização de dados

Como analista de datos, me gustaría crear visualizaciones que ilustren los insights obtenidos, facilitando su interpretación para stakeholders.

Como analista de dados, gostaria de criar visualizações que ilustrem os insights obtidos, facilitando a sua interpretação para os stakeholders.

--> Criterios de Aceptación / Critérios de Aceitação

Utilizar funcionalidades de plotaje o plataformas integradas para mostrar gráficos de distribución de notas por categorías / Usar funcionalidades de plotagem ou plataformas integradas para exibir gráficos de distribuição de notas por categoria

## 🛠️ Requisitos Técnicos

PySpark

Google Colab o similar / Google Colab ou similar

Pandas

Matplotlib o Seaborn

## 👨‍💻 Cómo Ejecutar el Proyecto / Como executar o projeto

Ejecutar el Notebook:

Abre el archivo SecondSimulator.ipynb en Google Colab o en tu entorno local favorito y sigue los pasos descritos en cada celda.

Abra o arquivo SecondSimulator.ipynb no Google Colab ou em seu ambiente local favorito e siga as etapas descritas em cada célula.

## 👀 Consideraciones Finales / Considerações Finais

Este proyecto es una simulación diseñada para mejorar mis habilidades en el análisis de datos utilizando PySpark. Es una excelente oportunidad para aplicar técnicas avanzadas en un entorno práctico.

¡Para mi fue gratificante analizar estos datos y descubrir insights valiosos! 🚀

Este projeto é uma simulação desenvolvida para aprimorar minhas habilidades em análise de dados usando PySpark. É uma excelente oportunidade para aplicar técnicas avançadas em um ambiente prático.

Foi gratificante para mim analisar esses dados e descobrir insights valiosos! 🚀

## 👩‍💻 Desarrolladora / Desenvolvedora

Ninoska Contreras

[![Linkedin Badge](https://img.shields.io/badge/-LinkedIn-blue?style=flat-square&logo=Linkedin&logoColor=white&link)](https://www.linkedin.com/in/ninoska-contreras)