{"id":20591489,"url":"https://github.com/lmtreser/intro-data-science","last_synced_at":"2026-04-13T15:33:18.831Z","repository":{"id":220674149,"uuid":"752260689","full_name":"lmtreser/intro-data-science","owner":"lmtreser","description":"Trayecto de formación en Ciencias de Datos con Python y Pandas","archived":false,"fork":false,"pushed_at":"2025-02-15T21:01:51.000Z","size":14254,"stargazers_count":0,"open_issues_count":0,"forks_count":0,"subscribers_count":1,"default_branch":"main","last_synced_at":"2025-03-06T13:46:13.583Z","etag":null,"topics":["data-science","matplotlib","numpy","pandas","python","seaborn"],"latest_commit_sha":null,"homepage":"https://lmtreser.github.io/intro-data-science/","language":"Jupyter Notebook","has_issues":true,"has_wiki":null,"has_pages":null,"mirror_url":null,"source_name":null,"license":"mit","status":null,"scm":"git","pull_requests_enabled":true,"icon_url":"https://github.com/lmtreser.png","metadata":{"files":{"readme":"README.md","changelog":null,"contributing":null,"funding":null,"license":"LICENSE","code_of_conduct":null,"threat_model":null,"audit":null,"citation":null,"codeowners":null,"security":null,"support":null,"governance":null,"roadmap":null,"authors":null,"dei":null,"publiccode":null,"codemeta":null}},"created_at":"2024-02-03T14:09:49.000Z","updated_at":"2025-02-15T21:01:54.000Z","dependencies_parsed_at":"2025-02-15T22:28:17.196Z","dependency_job_id":null,"html_url":"https://github.com/lmtreser/intro-data-science","commit_stats":null,"previous_names":["lmtreser/intro-data-science"],"tags_count":0,"template":false,"template_full_name":null,"purl":"pkg:github/lmtreser/intro-data-science","repository_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/lmtreser%2Fintro-data-science","tags_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/lmtreser%2Fintro-data-science/tags","releases_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/lmtreser%2Fintro-data-science/releases","manifests_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/lmtreser%2Fintro-data-science/manifests","owner_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners/lmtreser","download_url":"https://codeload.github.com/lmtreser/intro-data-science/tar.gz/refs/heads/main","sbom_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories/lmtreser%2Fintro-data-science/sbom","scorecard":null,"host":{"name":"GitHub","url":"https://github.com","kind":"github","repositories_count":286080680,"owners_count":31759443,"icon_url":"https://github.com/github.png","version":null,"created_at":"2022-05-30T11:31:42.601Z","updated_at":"2026-04-13T15:25:13.801Z","status":"ssl_error","status_checked_at":"2026-04-13T15:25:09.162Z","response_time":93,"last_error":"SSL_read: unexpected eof while reading","robots_txt_status":"success","robots_txt_updated_at":"2025-07-24T06:49:26.215Z","robots_txt_url":"https://github.com/robots.txt","online":false,"can_crawl_api":true,"host_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub","repositories_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repositories","repository_names_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/repository_names","owners_url":"https://repos.ecosyste.ms/api/v1/hosts/GitHub/owners"}},"keywords":["data-science","matplotlib","numpy","pandas","python","seaborn"],"created_at":"2024-11-16T07:40:32.212Z","updated_at":"2026-04-13T15:33:18.790Z","avatar_url":"https://github.com/lmtreser.png","language":"Jupyter Notebook","funding_links":[],"categories":[],"sub_categories":[],"readme":"# Ciencia de Datos 2023\n\nTrayecto tecnológico para docentes de escuelas secundarias técnicas, formación introductoria en Ciencias de Datos y Machine Learning. \n\nEn este curso se trabajó principalmente en la obtención, limpieza y visualización de datos con el lenguaje [Python](https://www.python.org/) y la biblioteca [Pandas](https://pandas.pydata.org/).\n\nLas tecnologías utilizadas son las siguientes:\n\n- [Jupyter](https://jupyter.org), informática interactiva en todos los lenguajes de programación\n- [pandas](https://pandas.pydata.org/), herramienta de manipulación y análisis de datos\n- [NumPy](https://numpy.org/), el paquete fundamental para la computación científica con Python\n- [seaborn](https://seaborn.pydata.org/), visualización de datos estadísticos\n- [Matplotlib](https://matplotlib.org/), visualización con Python\n- [scikit-learn](https://scikit-learn.org/), Machine Learning en Python\n\nLos resultados de mi trabajo final están en la *notebook* `./src/Proyecto Final.ipynb` junto a una copia del dataset utilizado en `./src/2023_Sysarmy_Encuesta_remuneración_salarial.csv`. También se puede consultar en la versión *html* a través del siguiente [enlace](https://lmtreser.github.io/intro-data-science/). \n\n## Recursos para investigar\n\n- [Python for Data Analysis](https://wesmckinney.com/book/)\n- [¿Para qué se usan los datos?](https://www.menti.com/aln328jrpez3)\n- [¿Para qué se usan los datos?](https://towardsdatascience.com/the-simpsons-meets-data-visualization-ef8ef0819d13)\n- [Internet Live Stats](https://www.internetlivestats.com)\n- [This Person Does Not Exist](https://thispersondoesnotexist.com)\n- [Drones Kamikaze con Inteligencia Artificial](https://www.youtube.com/watch?v=nVdu5uAtfVc)\n- [The Next Rembrandt](https://www.youtube.com/watch?v=IuygOYZ1Ngo)\n- [Google presentó un asistente que hace llamadas como un humano](https://www.youtube.com/watch?v=l9BTMWOupGM)\n- [¿Qué es y para qué sirve Data Lake?](https://www.youtube.com/watch?v=Tn2Esa0bv9A\u0026t=1s)\n- [Hans Rosling's 200 Countries, 200 Years, 4 Minutes](https://youtu.be/jbkSRLYSojo?si=WHdmbGlw_2tnFTxT)\n- [Tipos de gráficos estadísticos](https://youtu.be/9G4HPNVA5w4?si=IQrE4S3bjSip9XRI)\n- [Gráficas (pastel, barras e histograma)](https://youtu.be/k7CRbP5v8-o?si=rSPtaeKm4QfSJwGd)\n- [Artificial Intelligence: what everybody needs to know](https://www.youtube.com/watch?v=NpwznnFBym8)\n- [¿Qué es el Machine Learning?¿Y Deep Learning?](https://www.youtube.com/watch?v=KytW151dpqU)\n- [Por qué las estadísticas inteligentes son la clave para combatir el crimen](https://www.youtube.com/watch?v=ZJNESMhIxQ0)\n- [Machine Bias](https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing)\n- [sklearn.linear_model.LinearRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html)\n- [Salary](https://www.kaggle.com/datasets/rsadiq/salary)\n- [Regresión Lineal](https://phet.colorado.edu/sims/html/least-squares-regression/latest/least-squares-regression_es.html)\n- [Linear Regression](https://mlu-explain.github.io/linear-regression)\n- [Regresión Lineal y Mínimos Cuadrados Ordinarios](https://www.youtube.com/watch?v=k964_uNn3l0)\n- [¿Qué es el Aprendizaje Supervisado y No Supervisado?](https://www.youtube.com/watch?v=oT3arRRB2Cw)\n- [Mall Customer Segmentation Data](https://www.kaggle.com/datasets/vjchoudhary7/customer-segmentation-tutorial-in-python)\n- [K-means](https://scikit-learn.org/stable/modules/clustering.html)\n- [Visualizing K-Means algorithm with D3.js](http://tech.nitoyon.com/en/blog/2013/11/07/k-means)\n- [K-means clustering](http://shabal.in/visuals/kmeans/3.html)\n- [Visualizing K-Means Clustering](https://www.naftaliharris.com/blog/visualizing-k-means-clustering)\n- [StatQuest: K-means clustering](https://www.youtube.com/watch?v=4b5d3muPQmA)\n- [Teachable Machine](https://teachablemachine.withgoogle.com)\n- [ChatGPT](https://chat.openai.com)\n- [The Turing test: Can a computer pass for a human?](https://www.youtube.com/watch?v=3wLqsRLvV-c)\n- [60-Second Adventures in Thought](https://www.youtube.com/watch?v=TryOC83PH1g)\n\n## Licencia\n\nEste trabajo está protegido por la **Licencia MIT**. Puedes acceder a la versión original de la licencia (en inglés) a través del archivo [LICENSE](./LICENSE) o en línea en [The MIT License (MIT)](https://mit-license.org/). También proporcionamos una traducción no oficial desde [Wikipedia](https://es.m.wikipedia.org/wiki/Licencia_MIT#La_licencia):\n\nCopyright (c) 2024 Lucas Martín Treser\n\nPor la presente se concede permiso, libre de cargos, a cualquier persona que obtenga una copia de este software y de los archivos de documentación asociados (el \"Software\"), a utilizar el Software sin restricción, incluyendo sin limitación los derechos a usar, copiar, modificar, fusionar, publicar, distribuir, sublicenciar, y/o vender copias del Software, y a permitir a las personas a las que se les proporcione el Software a hacer lo mismo, sujeto a las siguientes condiciones:\n\nEl aviso de copyright anterior y este aviso de permiso se incluirán en todas las copias o partes sustanciales del Software.\n\nEL SOFTWARE SE PROPORCIONA \"COMO ESTÁ\", SIN GARANTÍA DE NINGÚN TIPO, EXPRESA O IMPLÍCITA, INCLUYENDO PERO NO LIMITADO A GARANTÍAS DE COMERCIALIZACIÓN, IDONEIDAD PARA UN PROPÓSITO PARTICULAR E INCUMPLIMIENTO. EN NINGÚN CASO LOS AUTORES O PROPIETARIOS DE LOS DERECHOS DE AUTOR SERÁN RESPONSABLES DE NINGUNA RECLAMACIÓN, DAÑOS U OTRAS RESPONSABILIDADES, YA SEA EN UNA ACCIÓN DE CONTRATO, AGRAVIO O CUALQUIER OTRO MOTIVO, DERIVADAS DE, FUERA DE O EN CONEXIÓN CON EL SOFTWARE O SU USO U OTRO TIPO DE ACCIONES EN EL SOFTWARE.\n","project_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Flmtreser%2Fintro-data-science","html_url":"https://awesome.ecosyste.ms/projects/github.com%2Flmtreser%2Fintro-data-science","lists_url":"https://awesome.ecosyste.ms/api/v1/projects/github.com%2Flmtreser%2Fintro-data-science/lists"}