An open API service indexing awesome lists of open source software.

https://github.com/lunanvarg/bid-data-cac22039

En este repositorio se vé mi TP Integrador del programa Codo a Codo: Big Data
https://github.com/lunanvarg/bid-data-cac22039

colab data-studio-google deepnote excel matplotlib mysql numpy pandas-library python seaborn

Last synced: 4 months ago
JSON representation

En este repositorio se vé mi TP Integrador del programa Codo a Codo: Big Data

Awesome Lists containing this project

README

        

:computer: Proyecto Integrador de Big Data

Este repositorio tiene el acceso a mi TP Integrador que formo parte de mi formación en Big Data como parte del programa de **Codo a Codo 4.0**.
Puedes explorar mi proyecto en Deepnote a través de este enlace: [Deepnote](https://deepnote.com/app/nancy-vargas-c001/6-TP-Final-Integrador-NancyVargas-9d04af23-3997-42ee-ac8f-bdd24141808e?utm_content=9d04af23-3997-42ee-ac8f-bdd24141808e)

---

## :school: Datos del Programa

### :dart: Objetivos del Programa

El programa Codo a Codo del **Ministerio de Educación de la Ciudad de Buenos Aires** tiene como objetivo capacitar a jóvenes y adultos en programación para que puedan insertarse laboralmente en el sector IT.

### :books: Contenido del Curso

**Durante el curso, he explorado una amplia variedad de temas, incluyendo:**

- Conceptos Generales, Lógica y Algoritmos.
- Bases de Datos, tanto relacionales como no relacionales, con un enfoque en SQL.
- Utilización de hojas de cálculo para análisis de datos.
- Introducción al Business Intelligence.
- Google Data Studio | Google Colab
- Creación de Informes y Dashboards.
- Programación en Python, incluyendo la interfaz gráfica e integración con bases de datos.
- Estadística descriptiva básica.
- Uso de librerías de Python orientadas a datos: Numpy, Pandas, Matplotlib, Seaborn.

### :star2: Importancia del Proyecto

Este proyecto representa un ejercicio práctico esencial para aplicar técnicas de análisis de Big Data, utilizando herramientas como Python, pandas y la plataforma Deepnote. A través de la integración y exploración de grandes volúmenes de datos, se buscó transformar información dispersa en conocimientos accionables que faciliten la toma de decisiones.

📊 **1. Análisis de grandes volúmenes de datos:**

Permite comprender cómo procesar, limpiar y analizar datasets complejos, una habilidad fundamental en entornos donde la información masiva es crucial para la estrategia empresaria.

🛠️ **2. Aplicación de herramientas y tecnologías:**

Utilizando entornos interactivos como Deepnote y bibliotecas avanzadas en Python, el proyecto refleja la capacidad de emplear herramientas modernas en la resolución de problemas reales de análisis de datos.

📈 **3. Generación de información para la toma de decisiones:**

A través del análisis exploratorio, la identificación de patrones y la creación de visualizaciones, el proyecto facilita una interpretación clara de los datos, aportando valor en la optimización de procesos y la predicción de tendencias.

🔍 **4. Desarrollo de habilidades analíticas y críticas:**

El trabajo fomenta el pensamiento crítico y la capacidad de interpretar resultados, habilidades fundamentales para la toma de decisiones fundamentadas en evidencia cuantitativa.

---

### :bulb: Objetivos Personales

Mi objetivo principal fue adquirir conocimientos básicos en bases de datos y aprender a utilizar herramientas como Python, SQL y Deepnote para analizar y gestionar grandes volúmenes de datos. Este curso marcó el inicio de mi formación en tecnología, fortaleciendo mi lógica de programación y sentando las bases para futuros aprendizajes en Power BI, Tableau, Python, Testing y Desarrollo de Software(proceso de aprendizaje).

***

## ⚡ Datos del README

Este proyecto corresponde al curso de Big Data del programa Codo a Codo 4.0 (primer cuatrimestre de 2022), donde se abordaron conceptos clave de bases de datos, análisis de datos y programación en Python. El trabajo final integra herramientas de programación y visualización para resolver un caso real de análisis de grandes volúmenes de información.

🎯 **Objetivos del Proyecto:**
- Aplicar Python para manipular y analizar grandes conjuntos de datos.
- Utilizar SQL para interactuar con bases de datos relacionales.
- Implementar técnicas de estadística para extraer insights.
- Desarrollar dashboards interactivos con Google Data Studio.
- Resolver un caso práctico simulando un escenario real de Big Data

🛠️ **Herramientas y Tecnologías:**
- Lenguaje: Python (pandas, matplotlib, seaborn).
- Bases de Datos: MySQL (gestión y consultas).
- Visualización: Google Data Studio, Excel/LibreOffice Calc.
- Entorno de Trabajo: Deepnote (Notebooks interactivos).

📈 **Resultados Principales:**
- Análisis exploratorio de datos utilizando Python y SQL.
- Visualización de patrones con dashboards interactivos.
- Conclusiones basadas en estadísticas descriptivas y gráficos.

---

### 💖 **Agradecimientos**
Quiero agradecer al equipo de [Codo a Codo 4.0](https://buenosaires.gob.ar/educacion/agencia-de-habilidades-para-el-futuro) y al profesor **José Luís González** por el acompañamiento durante el curso y por brindarnos las herramientas necesarias para comprender los fundamentos del **Big Data**.

---

### 📚 **Referencias y Recursos**
- [Documentación oficial de Python](https://docs.python.org/3/)
- [Guía de Pandas](https://pandas.pydata.org/docs/)
- [Google Data Studio](https://datastudio.google.com/)

---

### 📞 **Contacto**
- **Desarrollado por:** Nancy Vargas
- 📧 [LinkedIn](https://www.linkedin.com/in/vargasnancy)

---

### 📜 **Licencia**
Este proyecto está bajo la licencia **MIT** – Podés utilizarlo y modificarlo libremente.

---

### 🔜 **Próximos Pasos o Mejoras Futuras**
- Ampliar el análisis con más fuentes de datos.
- Automatizar procesos con scripts en Python.
- Integrar nuevas visualizaciones avanzadas.

💖💖💖💖💖