An open API service indexing awesome lists of open source software.

https://github.com/suzdalenko-dev/ia


https://github.com/suzdalenko-dev/ia

Last synced: about 1 month ago
JSON representation

Awesome Lists containing this project

README

          

# 📚 Roadmap Unificado IA + Matemáticas (2025)

> Objetivo: Convertirte en **profesional de IA en 12–15 meses**, con matemáticas sólidas y dominio de las **IAs más útiles hoy**:
> ML clásico, Deep Learning, NLP, LLMs, Generative AI, Visión, Recomendadores, Forecasting y MLOps.
> Resultado: **Portafolio con 10+ proyectos reales**, APIs en producción y un **motor de predicción de compras** con métricas de negocio.

---

# 🧮 Módulo 0 — Matemáticas esenciales (en paralelo, 1–2h/semana)

### Álgebra lineal
- **Qué**: vectores, matrices, normas, autovalores, SVD, PCA.
- **Usos**: embeddings, reducción de dimensión, visión.
- **Recursos**:
- Libro: *Mathematics for Machine Learning*.
- [3Blue1Brown — Álgebra lineal](https://www.3blue1brown.com/).
- **Entregable**: notebook con PCA desde cero.

### Cálculo y optimización
- **Qué**: gradientes, Jacobianos, descenso de gradiente, Adam.
- **Usos**: backprop, tuning de hiperparámetros.
- **Recursos**:
- Artículo: *Matrix Calculus for Deep Learning*.
- MIT OCW — *Multivariable Calculus*.
- **Entregable**: derivada de MSE y logística validada con autograd.

### Probabilidad y estadística
- **Qué**: distribuciones (Bernoulli, Normal, Poisson), Bayes, bootstrap.
- **Usos**: regresión logística, incertidumbre en forecast.
- **Recursos**: *Practical Statistics for Data Scientists*, [StatQuest](https://www.youtube.com/user/joshstarmer).
- **Entregable**: notebook con intervalos de confianza usando bootstrap.

### Series temporales
- **Qué**: autocorrelación, ARIMA, Holt-Winters.
- **Usos**: forecasting de demanda.
- **Recurso**: *Forecasting: Principles and Practice* (Hyndman).

---

# 🔹 Módulo 1 — Fundamentos Python científico (1 mes)

- **Semana 1–2**: Python avanzado, NumPy, Pandas.
- Proyecto: calculadora matricial + EDA Titanic.
- **Semana 3**: Visualización (Matplotlib, Seaborn).
- Proyecto: distribuciones de dataset real.
- **Semana 4**: Regresión lineal desde cero + scikit-learn.
- Proyecto: predicción de precios (California Housing).

---

# 🔹 Módulo 2 — Machine Learning clásico (2 meses)

- **Semana 5–6**: Regresión logística, Árboles, Random Forest.
- Proyecto: predicción de churn.
- **Semana 7**: KNN y SVM.
- Proyecto: clasificador de dígitos.
- **Semana 8**: Clustering (K-means, DBSCAN), PCA.
- Proyecto: segmentación de clientes.
- **Semana 9**: Gradient Boosting (XGBoost, LightGBM, CatBoost).
- Proyecto: predicción de churn con boosting.
- **Semana 10**: Pipelines sklearn + MLflow.
- Proyecto: predicción de precios de coches con pipeline completo.

---

# 🔹 Módulo 3 — Deep Learning (3 meses)

- **Semana 11**: MLP básico (PyTorch/Keras).
- Proyecto: MNIST con MLP.
- **Semana 12**: Optimización (SGD, Adam), regularización (dropout, batchnorm).
- Proyecto: comparar con/sin dropout.
- **Semana 13**: CNN.
- Proyecto: Cats vs Dogs.
- **Semana 14**: Transfer Learning (ResNet, MobileNet).
- Proyecto: clasificador de imágenes con modelo preentrenado.
- **Semana 15**: RNN y LSTM.
- Proyecto: predicción de texto carácter a carácter.
- **Semana 16**: Word embeddings (Word2Vec, GloVe).
- Proyecto: clasificador de reviews de Amazon.
- **Semana 17**: Transformers (BERT).
- Proyecto: clasificación de texto con BERT.
- **Semana 18**: Proyecto integrador: Chatbot Django + Transformers.

---

# 🔹 Módulo 4 — IA Generativa, NLP Avanzado y Forecasting (3 meses)

- **Semana 19**: Prompt engineering + LangChain.
- Proyecto: chatbot con prompts dinámicos.
- **Semana 20**: Fine-tuning ligero (LoRA, PEFT).
- Proyecto: clasificador de documentos PDF.
- **Semana 21**: Stable Diffusion.
- Proyecto: generador de logotipos.
- **Semana 22**: Text-to-SQL + búsqueda semántica (pgvector, FAISS).
- Proyecto: buscador inteligente sobre BD.
- **Semana 23**: Forecast de demanda (ETS/ARIMA, walk-forward).
- Proyecto: motor de predicción de compras.
- **Semana 24**: Integración Django + Vue + API IA.
- Proyecto: dashboard interactivo.

---

# 🔹 Módulo 5 — MLOps y Producción (3 meses)

- **Semana 25**: Docker para ML.
- Proyecto: contenedor reproducible.
- **Semana 26**: FastAPI + ONNX Runtime.
- Proyecto: API de predicciones.
- **Semana 27**: Kubernetes (minikube/k3d).
- Proyecto: despliegue cluster local.
- **Semana 28**: MLflow + DVC.
- Proyecto: versionado de modelos.
- **Semana 29**: CI/CD con GitHub Actions.
- Proyecto: pipeline automático.
- **Semana 30**: Proyecto final en Cloud (AWS/GCP/Azure).
- Entrega: API IA escalable en producción.

---

# 🤖 Tipos de IA que dominarás

1. **ML clásico**: regresión, árboles, boosting.
2. **DL**: MLP, CNN, RNN.
3. **Transformers/LLMs**: BERT, GPT, LoRA.
4. **Generative AI**: Stable Diffusion, text-to-image.
5. **RAG**: Retrieval-Augmented Generation.
6. **Recomendadores**: embeddings, colaborativos.
7. **Forecasting**: ARIMA, Croston, Holt-Winters.
8. **MLOps**: Docker, FastAPI, K8s, MLflow, CI/CD.

---

# 📂 Librerías y ecosistema (2025)

- **Datos**: NumPy, pandas, Polars, DuckDB.
- **ML clásico**: scikit-learn, XGBoost, LightGBM, CatBoost.
- **DL**: PyTorch, TensorFlow/Keras, timm, TorchMetrics, Lightning.
- **Visión**: OpenCV, Albumentations, YOLO.
- **NLP/LLMs**: Hugging Face (Transformers, Datasets), spaCy, SentencePiece, vLLM, TGI, llama.cpp.
- **RAG**: FAISS, pgvector, Qdrant, LangChain, LlamaIndex.
- **Calidad/monitoreo**: Evidently, Great Expectations, Ragas, Langfuse.
- **Serving**: FastAPI, ONNX Runtime, NVIDIA Triton, BentoML.
- **MLOps**: MLflow, DVC, Prefect/Airflow, KServe.
- **Web/móvil**: Transformers.js, TensorFlow.js, TFLite, ML Kit.

---

# 📘 Recursos recomendados

- **Libros**
- *Hands-On Machine Learning* (Géron).
- *Deep Learning* (Goodfellow).
- *Practical Statistics for Data Scientists*.
- *Forecasting: Principles and Practice* (Hyndman).

- **Cursos**
- Andrew Ng — *Machine Learning Specialization* (Coursera).
- Hugging Face — *NLP with Transformers*.
- Fast.ai — *Practical Deep Learning*.

- **YouTube**
- [3Blue1Brown](https://www.3blue1brown.com/) (matemáticas visuales).
- [StatQuest](https://www.youtube.com/user/joshstarmer) (ML y estadística clara).
- [Sentdex](https://www.youtube.com/user/sentdex) (PyTorch práctico).

- **Repos**
- [Scikit-learn examples](https://scikit-learn.org/stable/auto_examples/index.html).
- [PyTorch tutorials](https://pytorch.org/tutorials/).
- [Hugging Face Transformers](https://huggingface.co/docs/transformers/index).
- [LangChain docs](https://python.langchain.com/).

---

# ✅ Checklist de avance

- [ ] Módulo 0 — Matemáticas esenciales.
- [ ] Módulo 1 — Fundamentos.
- [ ] Módulo 2 — ML clásico.
- [ ] Módulo 3 — Deep Learning.
- [ ] Módulo 4 — Generativa + Forecasting + NLP avanzado.
- [ ] Módulo 5 — MLOps.
- [ ] Proyecto final desplegado en Cloud.

---

# 📌 Pro Tip

Este README es tu **contrato de aprendizaje**:
- Cada semana entrega un **notebook + README del proyecto**.
- Sube *screenshots* y métricas a `/reports`.
- Documenta un **post-mortem** corto: qué aprendiste y qué mejorarás.

---