An open API service indexing awesome lists of open source software.

https://github.com/lmtreser/intro-data-science

Trayecto de formación en Ciencias de Datos con Python y Pandas
https://github.com/lmtreser/intro-data-science

data-science matplotlib numpy pandas python seaborn

Last synced: 11 months ago
JSON representation

Trayecto de formación en Ciencias de Datos con Python y Pandas

Awesome Lists containing this project

README

          

# Ciencia de Datos 2023

Trayecto tecnológico para docentes de escuelas secundarias técnicas, formación introductoria en Ciencias de Datos y Machine Learning.

En este curso se trabajó principalmente en la obtención, limpieza y visualización de datos con el lenguaje [Python](https://www.python.org/) y la biblioteca [Pandas](https://pandas.pydata.org/).

Las tecnologías utilizadas son las siguientes:

- [Jupyter](https://jupyter.org), informática interactiva en todos los lenguajes de programación
- [pandas](https://pandas.pydata.org/), herramienta de manipulación y análisis de datos
- [NumPy](https://numpy.org/), el paquete fundamental para la computación científica con Python
- [seaborn](https://seaborn.pydata.org/), visualización de datos estadísticos
- [Matplotlib](https://matplotlib.org/), visualización con Python
- [scikit-learn](https://scikit-learn.org/), Machine Learning en Python

Los resultados de mi trabajo final están en la *notebook* `./src/Proyecto Final.ipynb` junto a una copia del dataset utilizado en `./src/2023_Sysarmy_Encuesta_remuneración_salarial.csv`. También se puede consultar en la versión *html* a través del siguiente [enlace](https://lmtreser.github.io/intro-data-science/).

## Recursos para investigar

- [Python for Data Analysis](https://wesmckinney.com/book/)
- [¿Para qué se usan los datos?](https://www.menti.com/aln328jrpez3)
- [¿Para qué se usan los datos?](https://towardsdatascience.com/the-simpsons-meets-data-visualization-ef8ef0819d13)
- [Internet Live Stats](https://www.internetlivestats.com)
- [This Person Does Not Exist](https://thispersondoesnotexist.com)
- [Drones Kamikaze con Inteligencia Artificial](https://www.youtube.com/watch?v=nVdu5uAtfVc)
- [The Next Rembrandt](https://www.youtube.com/watch?v=IuygOYZ1Ngo)
- [Google presentó un asistente que hace llamadas como un humano](https://www.youtube.com/watch?v=l9BTMWOupGM)
- [¿Qué es y para qué sirve Data Lake?](https://www.youtube.com/watch?v=Tn2Esa0bv9A&t=1s)
- [Hans Rosling's 200 Countries, 200 Years, 4 Minutes](https://youtu.be/jbkSRLYSojo?si=WHdmbGlw_2tnFTxT)
- [Tipos de gráficos estadísticos](https://youtu.be/9G4HPNVA5w4?si=IQrE4S3bjSip9XRI)
- [Gráficas (pastel, barras e histograma)](https://youtu.be/k7CRbP5v8-o?si=rSPtaeKm4QfSJwGd)
- [Artificial Intelligence: what everybody needs to know](https://www.youtube.com/watch?v=NpwznnFBym8)
- [¿Qué es el Machine Learning?¿Y Deep Learning?](https://www.youtube.com/watch?v=KytW151dpqU)
- [Por qué las estadísticas inteligentes son la clave para combatir el crimen](https://www.youtube.com/watch?v=ZJNESMhIxQ0)
- [Machine Bias](https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing)
- [sklearn.linear_model.LinearRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html)
- [Salary](https://www.kaggle.com/datasets/rsadiq/salary)
- [Regresión Lineal](https://phet.colorado.edu/sims/html/least-squares-regression/latest/least-squares-regression_es.html)
- [Linear Regression](https://mlu-explain.github.io/linear-regression)
- [Regresión Lineal y Mínimos Cuadrados Ordinarios](https://www.youtube.com/watch?v=k964_uNn3l0)
- [¿Qué es el Aprendizaje Supervisado y No Supervisado?](https://www.youtube.com/watch?v=oT3arRRB2Cw)
- [Mall Customer Segmentation Data](https://www.kaggle.com/datasets/vjchoudhary7/customer-segmentation-tutorial-in-python)
- [K-means](https://scikit-learn.org/stable/modules/clustering.html)
- [Visualizing K-Means algorithm with D3.js](http://tech.nitoyon.com/en/blog/2013/11/07/k-means)
- [K-means clustering](http://shabal.in/visuals/kmeans/3.html)
- [Visualizing K-Means Clustering](https://www.naftaliharris.com/blog/visualizing-k-means-clustering)
- [StatQuest: K-means clustering](https://www.youtube.com/watch?v=4b5d3muPQmA)
- [Teachable Machine](https://teachablemachine.withgoogle.com)
- [ChatGPT](https://chat.openai.com)
- [The Turing test: Can a computer pass for a human?](https://www.youtube.com/watch?v=3wLqsRLvV-c)
- [60-Second Adventures in Thought](https://www.youtube.com/watch?v=TryOC83PH1g)

## Licencia

Este trabajo está protegido por la **Licencia MIT**. Puedes acceder a la versión original de la licencia (en inglés) a través del archivo [LICENSE](./LICENSE) o en línea en [The MIT License (MIT)](https://mit-license.org/). También proporcionamos una traducción no oficial desde [Wikipedia](https://es.m.wikipedia.org/wiki/Licencia_MIT#La_licencia):

Copyright (c) 2024 Lucas Martín Treser

Por la presente se concede permiso, libre de cargos, a cualquier persona que obtenga una copia de este software y de los archivos de documentación asociados (el "Software"), a utilizar el Software sin restricción, incluyendo sin limitación los derechos a usar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar, y/o vender copias del Software, y a permitir a las personas a las que se les proporcione el Software a hacer lo mismo, sujeto a las siguientes condiciones:

El aviso de copyright anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.

EL SOFTWARE SE PROPORCIONA "COMO ESTÁ", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO PERO NO LIMITADO A GARANTÍAS DE COMERCIALIZACIÓN, IDONEIDAD PARA UN PROPÓSITO PARTICULAR E INCUMPLIMIENTO. EN NINGÚN CASO LOS AUTORES O PROPIETARIOS DE LOS DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGUNA RECLAMACIÓN, DAÑOS U OTRAS RESPONSABILIDADES, YA SEA EN UNA ACCIÓN DE CONTRATO, AGRAVIO O CUALQUIER OTRO MOTIVO, DERIVADAS DE, FUERA DE O EN CONEXIÓN CON EL SOFTWARE O SU USO U OTRO TIPO DE ACCIONES EN EL SOFTWARE.