Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

Awesome Lists | Featured Topics | Projects

https://github.com/dccuchile/CC5205

Introducción a la Minería de Datos
https://github.com/dccuchile/CC5205

Last synced: 3 months ago
JSON representation

Introducción a la Minería de Datos

Awesome Lists containing this project

README

        

# CC5205
Repositorio del curso Minería de Datos dictado en el Departamento de Ciencias de la Computación de la Universidad de Chile

* [Playlist de Youtube con videos de clases](https://www.youtube.com/playlist?list=PLKUV14d0mKnUXXfmhqqZdcsNGAuV2GZda)

* [Reglas del Curso](reglas_curso.md)

* [Calendario Secciones 1 y 2](cal_S12.md)

* [Calendario Sección 3](cal_S3.md)

* [Sugerencias de Proyecto](sugerencias_proyecto.md)

* El material de este curso ha estado en constante actualización. Durante este proceso han participado
* [Bárbara Poblete](https://www.barbara.cl/) (creadora del curso original)
* [Felipe Bravo-Marquez](https://felipebravom.com/)
* [Andrés Abeliuk](https://aabeliuk.github.io/)
* [Hernán Sarmiento](https://scholar.google.com/citations?user=LlvbtQ0AAAAJ&hl=es)
* [Jazmine Maldonado](https://www.linkedin.com/in/jazminemf/)
* [Cinthia Sánchez](https://users.dcc.uchile.cl/~cisanche/)
* [Valentin Barriere](https://dcc.uchile.cl/pregrado/academico/valentin-barriere)

## Slides

1. [Clase 1: Introducción a la Minería de Datos](https://drive.google.com/file/d/1wQgS2ymmROgOiHRkiLqQaqBtvKJCXG_P/view?usp=sharing)

1. [Clase 2: Datos](https://drive.google.com/file/d/1cgaFdskQDS79cuB1pCdY0CuCJaARLiSo/view?usp=sharing)

1. [Clase 3: Análisis Exploratorio de Datos](https://docs.google.com/presentation/d/16pOVrrTo_4mHuGNVA_z95vFtgc_zkbd2nN3JBeis4fE/edit?usp=sharing) - [Google colab con los códigos de ejemplo](https://colab.research.google.com/drive/17xaDJJxQQBQtCHK6AMr0hrfvxQBjKTkU?usp=sharing).

1. [Clase 4: Introducción al Aprendizaje Supervisado](https://drive.google.com/file/d/1Ig0SeBtp_ONIOToj-LL9pomJ2SQwjyVj/view?usp=sharing)

1. [Clase 5: Algoritmos de clasificación - Árboles, KNN, Naive Bayes](https://docs.google.com/presentation/d/1_fQRS2SJ4YbhAsCfdPQ2kTK9FpUm5Gi67VD6SMBlDFs/edit?usp=sharing)

1. [Clase 6: Modelos Lineales - Regresión y Clasificación](https://drive.google.com/file/d/1YD8AL7inU1FwseCgSf_4Hv7kyvDZFcJN/view?usp=sharing)

1. [Clase 7: Support Vector Machines](https://drive.google.com/file/d/1N8-VqXXLOcOPgDFpuFErKwOuhIduXLJ-/view?usp=sharing)

1. [Clase 8: Clustering - Introducción y Algoritmos](https://docs.google.com/presentation/d/1V1ftUsuiHfdErWeXKWBUP6pOG4DrFWSE3_Af8ULNRcs/edit?usp=sharing)

1. [Clase 9: Validación de Clusters](https://docs.google.com/presentation/d/137sQ5C68NTj-XMbqYwQSnJ8kCEYqRxAmAhwJQRy6bzU/edit?usp=sharing)

1. [Clase 10: Selección y Reducción de atributos](https://docs.google.com/presentation/d/1O1hUXQhp8GTPErEhFbpzAempHFVOq6ic8XND4_NgQNw/edit?usp=sharing)

1. [Clase 11: Introducción a las Redes Neuronales](https://drive.google.com/file/d/1VLx0bgLPqKX641CNDV73AP2vd3ie6O2E/view?usp=sharing)

### Material Extra

1. [Material Extra 1: Fundamentos Matemáticos para Minería de Datos y Machine Learning](https://docs.google.com/presentation/d/1aKb91y7uiuweIxdt5PYOCAZPlFPZoWbzMdzWCxuQMH4/edit?usp=sharing)

1. [Material Extra 2: Límites Estadísticos de la Minería de Datos](https://docs.google.com/presentation/d/1PwhgavtGpiRbHXRwi9-mlIANXGyI4n2m2p1JlGFPV5U/edit?usp=sharing)

1. [Material Extra 3: Clustering de Series de Tiempo](https://docs.google.com/presentation/d/1SN866ZwZriiy0LXWBF81QveoLTjgkd3lXgtu5i5a0so/edit?usp=sharing)

1. [Material Extra 4: Clustering - Casos de Estudio](https://docs.google.com/presentation/d/19cYVktPQvgjrnGH5a2gqVDvrD9g0XmdNBl0A30X_uxQ/edit?usp=sharing)

1. [Material Extra 5: Privacidad en Minería de Datos](https://docs.google.com/presentation/d/1S-GyLw0_svkTF-RAdxq6EgedP29qCk1qzNrQ7Z5Le2I/edit?usp=sharing)

1. [Material Extra 6: Minería de Reglas de Asociación](https://docs.google.com/presentation/d/1Ooy-I9WKhwAzJSvcBxiaqXLbP0i5JVQRWY0R_rYuSH0/edit?usp=sharing)

1. [Material Extra 7: Ética en Datos](https://docs.google.com/presentation/d/1dqH-EC7Th1dInc1cU6qnqq4y-BKs_GdPRndzFbik0dI/edit?usp=sharing)

1. [Material Extra 8: Ética en Machine Learning - Identificando riesgos y estrategias de mitigación](https://docs.google.com/presentation/d/1o2hfLJNxqkEfWd9GCubCrWeDaCtz3YKxaGne8rod9cc/edit?usp=sharing)

1. [Material Extra 9: Grandes Modelos de Lenguaje - Recorrido Histórico](https://docs.google.com/presentation/d/1t8cjmVu4xdSg6197XaOsC2YZIzH7oy4tMl-Yhc6dnHk/edit?usp=sharing)

## Links

1. [Libro: Introduction to Data Mining (Second Edition)](https://www-users.cs.umn.edu/~kumar001/dmbook/index.php), [Software and Tutorials](http://www.cse.msu.edu/~ptan/dmbook/software/)
2. [Libro: Hands-on Machine Learning with Scikit-Learn, Keras and TensorFlow (Third Edition)](https://www.oreilly.com/library/view/hands-on-machine-learning/9781098125967/) [Notebooks](https://github.com/ageron/handson-ml3)
3. [Libro: Mining of Massive Datasets de Jure Leskovec., Anand Rajaraman y Jeff Ullman](http://www.mmds.org/)
4. [Fundamentals of Data Visualization by Claus O. Wilke](https://clauswilke.com/dataviz/)
5. [Maching Learning Mastery](https://machinelearningmastery.com/start-here/)
6. [Repositorio antiguo del curso por Mauricio Quezada](https://github.com/mquezada/uchile-cc5206)
7. [Proyectos de años anteriores](https://prisma.dcc.uchile.cl/cursoMD/)
8. [Perfil de Hans Rosling en TED](https://www.ted.com/speakers/hans_rosling)
9. [Python Machine Learning book code repository](https://github.com/rasbt/python-machine-learning-book)
10. [Machine learning examples: A collection of machine learning examples and tutorials](https://github.com/lazyprogrammer/machine_learning_examples)
11. [KDnuggets: sitio Web muy popular sobre DM, ML, AI, etc](https://www.kdnuggets.com/)
12. [Centroid Initialization Methods for k-means Clustering - KDnuggets](https://www.kdnuggets.com/2020/06/centroid-initialization-k-means-clustering.html)
13. [Nested Cross-Validation for Machine Learning with Python](https://machinelearningmastery.com/nested-cross-validation-for-machine-learning-with-python/)
14. [Mathematics for Machine Learning](https://t.co/8ut4HxLMbE?amp=1)
15. [FAISS a library for very fast clustering](https://github.com/facebookresearch/faiss)
16. [Data Transformation: Standardization vs Normalization](https://www.kdnuggets.com/2020/04/data-transformation-standardization-normalization.html)
17. [Machine learning sucks at covid by Cory Doctorow](https://pluralistic.net/2021/08/02/autoquack/#gigo)