https://github.com/lmtreser/intro-data-science
Trayecto de formación en Ciencias de Datos con Python y Pandas
https://github.com/lmtreser/intro-data-science
data-science matplotlib numpy pandas python seaborn
Last synced: 11 months ago
JSON representation
Trayecto de formación en Ciencias de Datos con Python y Pandas
- Host: GitHub
- URL: https://github.com/lmtreser/intro-data-science
- Owner: lmtreser
- License: mit
- Created: 2024-02-03T14:09:49.000Z (about 2 years ago)
- Default Branch: main
- Last Pushed: 2025-02-15T21:01:51.000Z (12 months ago)
- Last Synced: 2025-02-15T22:18:27.986Z (12 months ago)
- Topics: data-science, matplotlib, numpy, pandas, python, seaborn
- Language: Jupyter Notebook
- Homepage: https://lmtreser.github.io/intro-data-science/
- Size: 13.6 MB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# Ciencia de Datos 2023
Trayecto tecnológico para docentes de escuelas secundarias técnicas, formación introductoria en Ciencias de Datos y Machine Learning.
En este curso se trabajó principalmente en la obtención, limpieza y visualización de datos con el lenguaje [Python](https://www.python.org/) y la biblioteca [Pandas](https://pandas.pydata.org/).
Las tecnologías utilizadas son las siguientes:
- [Jupyter](https://jupyter.org), informática interactiva en todos los lenguajes de programación
- [pandas](https://pandas.pydata.org/), herramienta de manipulación y análisis de datos
- [NumPy](https://numpy.org/), el paquete fundamental para la computación científica con Python
- [seaborn](https://seaborn.pydata.org/), visualización de datos estadísticos
- [Matplotlib](https://matplotlib.org/), visualización con Python
- [scikit-learn](https://scikit-learn.org/), Machine Learning en Python
Los resultados de mi trabajo final están en la *notebook* `./src/Proyecto Final.ipynb` junto a una copia del dataset utilizado en `./src/2023_Sysarmy_Encuesta_remuneración_salarial.csv`. También se puede consultar en la versión *html* a través del siguiente [enlace](https://lmtreser.github.io/intro-data-science/).
## Recursos para investigar
- [Python for Data Analysis](https://wesmckinney.com/book/)
- [¿Para qué se usan los datos?](https://www.menti.com/aln328jrpez3)
- [¿Para qué se usan los datos?](https://towardsdatascience.com/the-simpsons-meets-data-visualization-ef8ef0819d13)
- [Internet Live Stats](https://www.internetlivestats.com)
- [This Person Does Not Exist](https://thispersondoesnotexist.com)
- [Drones Kamikaze con Inteligencia Artificial](https://www.youtube.com/watch?v=nVdu5uAtfVc)
- [The Next Rembrandt](https://www.youtube.com/watch?v=IuygOYZ1Ngo)
- [Google presentó un asistente que hace llamadas como un humano](https://www.youtube.com/watch?v=l9BTMWOupGM)
- [¿Qué es y para qué sirve Data Lake?](https://www.youtube.com/watch?v=Tn2Esa0bv9A&t=1s)
- [Hans Rosling's 200 Countries, 200 Years, 4 Minutes](https://youtu.be/jbkSRLYSojo?si=WHdmbGlw_2tnFTxT)
- [Tipos de gráficos estadísticos](https://youtu.be/9G4HPNVA5w4?si=IQrE4S3bjSip9XRI)
- [Gráficas (pastel, barras e histograma)](https://youtu.be/k7CRbP5v8-o?si=rSPtaeKm4QfSJwGd)
- [Artificial Intelligence: what everybody needs to know](https://www.youtube.com/watch?v=NpwznnFBym8)
- [¿Qué es el Machine Learning?¿Y Deep Learning?](https://www.youtube.com/watch?v=KytW151dpqU)
- [Por qué las estadísticas inteligentes son la clave para combatir el crimen](https://www.youtube.com/watch?v=ZJNESMhIxQ0)
- [Machine Bias](https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing)
- [sklearn.linear_model.LinearRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html)
- [Salary](https://www.kaggle.com/datasets/rsadiq/salary)
- [Regresión Lineal](https://phet.colorado.edu/sims/html/least-squares-regression/latest/least-squares-regression_es.html)
- [Linear Regression](https://mlu-explain.github.io/linear-regression)
- [Regresión Lineal y Mínimos Cuadrados Ordinarios](https://www.youtube.com/watch?v=k964_uNn3l0)
- [¿Qué es el Aprendizaje Supervisado y No Supervisado?](https://www.youtube.com/watch?v=oT3arRRB2Cw)
- [Mall Customer Segmentation Data](https://www.kaggle.com/datasets/vjchoudhary7/customer-segmentation-tutorial-in-python)
- [K-means](https://scikit-learn.org/stable/modules/clustering.html)
- [Visualizing K-Means algorithm with D3.js](http://tech.nitoyon.com/en/blog/2013/11/07/k-means)
- [K-means clustering](http://shabal.in/visuals/kmeans/3.html)
- [Visualizing K-Means Clustering](https://www.naftaliharris.com/blog/visualizing-k-means-clustering)
- [StatQuest: K-means clustering](https://www.youtube.com/watch?v=4b5d3muPQmA)
- [Teachable Machine](https://teachablemachine.withgoogle.com)
- [ChatGPT](https://chat.openai.com)
- [The Turing test: Can a computer pass for a human?](https://www.youtube.com/watch?v=3wLqsRLvV-c)
- [60-Second Adventures in Thought](https://www.youtube.com/watch?v=TryOC83PH1g)
## Licencia
Este trabajo está protegido por la **Licencia MIT**. Puedes acceder a la versión original de la licencia (en inglés) a través del archivo [LICENSE](./LICENSE) o en línea en [The MIT License (MIT)](https://mit-license.org/). También proporcionamos una traducción no oficial desde [Wikipedia](https://es.m.wikipedia.org/wiki/Licencia_MIT#La_licencia):
Copyright (c) 2024 Lucas Martín Treser
Por la presente se concede permiso, libre de cargos, a cualquier persona que obtenga una copia de este software y de los archivos de documentación asociados (el "Software"), a utilizar el Software sin restricción, incluyendo sin limitación los derechos a usar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar, y/o vender copias del Software, y a permitir a las personas a las que se les proporcione el Software a hacer lo mismo, sujeto a las siguientes condiciones:
El aviso de copyright anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.
EL SOFTWARE SE PROPORCIONA "COMO ESTÁ", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO PERO NO LIMITADO A GARANTÍAS DE COMERCIALIZACIÓN, IDONEIDAD PARA UN PROPÓSITO PARTICULAR E INCUMPLIMIENTO. EN NINGÚN CASO LOS AUTORES O PROPIETARIOS DE LOS DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGUNA RECLAMACIÓN, DAÑOS U OTRAS RESPONSABILIDADES, YA SEA EN UNA ACCIÓN DE CONTRATO, AGRAVIO O CUALQUIER OTRO MOTIVO, DERIVADAS DE, FUERA DE O EN CONEXIÓN CON EL SOFTWARE O SU USO U OTRO TIPO DE ACCIONES EN EL SOFTWARE.