https://github.com/lunanvarg/bid-data-cac22039
En este repositorio se vé mi TP Integrador del programa Codo a Codo: Big Data
https://github.com/lunanvarg/bid-data-cac22039
colab data-studio-google deepnote excel matplotlib mysql numpy pandas-library python seaborn
Last synced: 4 months ago
JSON representation
En este repositorio se vé mi TP Integrador del programa Codo a Codo: Big Data
- Host: GitHub
- URL: https://github.com/lunanvarg/bid-data-cac22039
- Owner: LuNanVarg
- Created: 2025-02-27T05:51:04.000Z (4 months ago)
- Default Branch: main
- Last Pushed: 2025-02-27T07:18:41.000Z (4 months ago)
- Last Synced: 2025-02-27T09:05:13.430Z (4 months ago)
- Topics: colab, data-studio-google, deepnote, excel, matplotlib, mysql, numpy, pandas-library, python, seaborn
- Homepage:
- Size: 5.86 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
:computer: Proyecto Integrador de Big Data
Este repositorio tiene el acceso a mi TP Integrador que formo parte de mi formación en Big Data como parte del programa de **Codo a Codo 4.0**.
Puedes explorar mi proyecto en Deepnote a través de este enlace: [Deepnote](https://deepnote.com/app/nancy-vargas-c001/6-TP-Final-Integrador-NancyVargas-9d04af23-3997-42ee-ac8f-bdd24141808e?utm_content=9d04af23-3997-42ee-ac8f-bdd24141808e)
---## :school: Datos del Programa
### :dart: Objetivos del Programa
El programa Codo a Codo del **Ministerio de Educación de la Ciudad de Buenos Aires** tiene como objetivo capacitar a jóvenes y adultos en programación para que puedan insertarse laboralmente en el sector IT.
### :books: Contenido del Curso
**Durante el curso, he explorado una amplia variedad de temas, incluyendo:**
- Conceptos Generales, Lógica y Algoritmos.
- Bases de Datos, tanto relacionales como no relacionales, con un enfoque en SQL.
- Utilización de hojas de cálculo para análisis de datos.
- Introducción al Business Intelligence.
- Google Data Studio | Google Colab
- Creación de Informes y Dashboards.
- Programación en Python, incluyendo la interfaz gráfica e integración con bases de datos.
- Estadística descriptiva básica.
- Uso de librerías de Python orientadas a datos: Numpy, Pandas, Matplotlib, Seaborn.### :star2: Importancia del Proyecto
Este proyecto representa un ejercicio práctico esencial para aplicar técnicas de análisis de Big Data, utilizando herramientas como Python, pandas y la plataforma Deepnote. A través de la integración y exploración de grandes volúmenes de datos, se buscó transformar información dispersa en conocimientos accionables que faciliten la toma de decisiones.
📊 **1. Análisis de grandes volúmenes de datos:**
Permite comprender cómo procesar, limpiar y analizar datasets complejos, una habilidad fundamental en entornos donde la información masiva es crucial para la estrategia empresaria.
🛠️ **2. Aplicación de herramientas y tecnologías:**
Utilizando entornos interactivos como Deepnote y bibliotecas avanzadas en Python, el proyecto refleja la capacidad de emplear herramientas modernas en la resolución de problemas reales de análisis de datos.
📈 **3. Generación de información para la toma de decisiones:**
A través del análisis exploratorio, la identificación de patrones y la creación de visualizaciones, el proyecto facilita una interpretación clara de los datos, aportando valor en la optimización de procesos y la predicción de tendencias.
🔍 **4. Desarrollo de habilidades analíticas y críticas:**
El trabajo fomenta el pensamiento crítico y la capacidad de interpretar resultados, habilidades fundamentales para la toma de decisiones fundamentadas en evidencia cuantitativa.
---
### :bulb: Objetivos Personales
Mi objetivo principal fue adquirir conocimientos básicos en bases de datos y aprender a utilizar herramientas como Python, SQL y Deepnote para analizar y gestionar grandes volúmenes de datos. Este curso marcó el inicio de mi formación en tecnología, fortaleciendo mi lógica de programación y sentando las bases para futuros aprendizajes en Power BI, Tableau, Python, Testing y Desarrollo de Software(proceso de aprendizaje).
***
## ⚡ Datos del README
Este proyecto corresponde al curso de Big Data del programa Codo a Codo 4.0 (primer cuatrimestre de 2022), donde se abordaron conceptos clave de bases de datos, análisis de datos y programación en Python. El trabajo final integra herramientas de programación y visualización para resolver un caso real de análisis de grandes volúmenes de información.
🎯 **Objetivos del Proyecto:**
- Aplicar Python para manipular y analizar grandes conjuntos de datos.
- Utilizar SQL para interactuar con bases de datos relacionales.
- Implementar técnicas de estadística para extraer insights.
- Desarrollar dashboards interactivos con Google Data Studio.
- Resolver un caso práctico simulando un escenario real de Big Data🛠️ **Herramientas y Tecnologías:**
- Lenguaje: Python (pandas, matplotlib, seaborn).
- Bases de Datos: MySQL (gestión y consultas).
- Visualización: Google Data Studio, Excel/LibreOffice Calc.
- Entorno de Trabajo: Deepnote (Notebooks interactivos).📈 **Resultados Principales:**
- Análisis exploratorio de datos utilizando Python y SQL.
- Visualización de patrones con dashboards interactivos.
- Conclusiones basadas en estadísticas descriptivas y gráficos.---
### 💖 **Agradecimientos**
Quiero agradecer al equipo de [Codo a Codo 4.0](https://buenosaires.gob.ar/educacion/agencia-de-habilidades-para-el-futuro) y al profesor **José Luís González** por el acompañamiento durante el curso y por brindarnos las herramientas necesarias para comprender los fundamentos del **Big Data**.---
### 📚 **Referencias y Recursos**
- [Documentación oficial de Python](https://docs.python.org/3/)
- [Guía de Pandas](https://pandas.pydata.org/docs/)
- [Google Data Studio](https://datastudio.google.com/)---
### 📞 **Contacto**
- **Desarrollado por:** Nancy Vargas
- 📧 [LinkedIn](https://www.linkedin.com/in/vargasnancy)---
### 📜 **Licencia**
Este proyecto está bajo la licencia **MIT** – Podés utilizarlo y modificarlo libremente.---
### 🔜 **Próximos Pasos o Mejoras Futuras**
- Ampliar el análisis con más fuentes de datos.
- Automatizar procesos con scripts en Python.
- Integrar nuevas visualizaciones avanzadas.💖💖💖💖💖