https://github.com/suzdalenko-dev/ia
https://github.com/suzdalenko-dev/ia
Last synced: about 1 month ago
JSON representation
- Host: GitHub
- URL: https://github.com/suzdalenko-dev/ia
- Owner: suzdalenko-dev
- Created: 2025-02-23T20:48:22.000Z (about 1 year ago)
- Default Branch: main
- Last Pushed: 2025-02-24T10:35:42.000Z (about 1 year ago)
- Last Synced: 2025-02-24T11:37:16.331Z (about 1 year ago)
- Language: HTML
- Homepage: https://suzdalenko-dev.github.io/ia
- Size: 5.86 KB
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
Awesome Lists containing this project
README
# 📚 Roadmap Unificado IA + Matemáticas (2025)
> Objetivo: Convertirte en **profesional de IA en 12–15 meses**, con matemáticas sólidas y dominio de las **IAs más útiles hoy**:
> ML clásico, Deep Learning, NLP, LLMs, Generative AI, Visión, Recomendadores, Forecasting y MLOps.
> Resultado: **Portafolio con 10+ proyectos reales**, APIs en producción y un **motor de predicción de compras** con métricas de negocio.
---
# 🧮 Módulo 0 — Matemáticas esenciales (en paralelo, 1–2h/semana)
### Álgebra lineal
- **Qué**: vectores, matrices, normas, autovalores, SVD, PCA.
- **Usos**: embeddings, reducción de dimensión, visión.
- **Recursos**:
- Libro: *Mathematics for Machine Learning*.
- [3Blue1Brown — Álgebra lineal](https://www.3blue1brown.com/).
- **Entregable**: notebook con PCA desde cero.
### Cálculo y optimización
- **Qué**: gradientes, Jacobianos, descenso de gradiente, Adam.
- **Usos**: backprop, tuning de hiperparámetros.
- **Recursos**:
- Artículo: *Matrix Calculus for Deep Learning*.
- MIT OCW — *Multivariable Calculus*.
- **Entregable**: derivada de MSE y logística validada con autograd.
### Probabilidad y estadística
- **Qué**: distribuciones (Bernoulli, Normal, Poisson), Bayes, bootstrap.
- **Usos**: regresión logística, incertidumbre en forecast.
- **Recursos**: *Practical Statistics for Data Scientists*, [StatQuest](https://www.youtube.com/user/joshstarmer).
- **Entregable**: notebook con intervalos de confianza usando bootstrap.
### Series temporales
- **Qué**: autocorrelación, ARIMA, Holt-Winters.
- **Usos**: forecasting de demanda.
- **Recurso**: *Forecasting: Principles and Practice* (Hyndman).
---
# 🔹 Módulo 1 — Fundamentos Python científico (1 mes)
- **Semana 1–2**: Python avanzado, NumPy, Pandas.
- Proyecto: calculadora matricial + EDA Titanic.
- **Semana 3**: Visualización (Matplotlib, Seaborn).
- Proyecto: distribuciones de dataset real.
- **Semana 4**: Regresión lineal desde cero + scikit-learn.
- Proyecto: predicción de precios (California Housing).
---
# 🔹 Módulo 2 — Machine Learning clásico (2 meses)
- **Semana 5–6**: Regresión logística, Árboles, Random Forest.
- Proyecto: predicción de churn.
- **Semana 7**: KNN y SVM.
- Proyecto: clasificador de dígitos.
- **Semana 8**: Clustering (K-means, DBSCAN), PCA.
- Proyecto: segmentación de clientes.
- **Semana 9**: Gradient Boosting (XGBoost, LightGBM, CatBoost).
- Proyecto: predicción de churn con boosting.
- **Semana 10**: Pipelines sklearn + MLflow.
- Proyecto: predicción de precios de coches con pipeline completo.
---
# 🔹 Módulo 3 — Deep Learning (3 meses)
- **Semana 11**: MLP básico (PyTorch/Keras).
- Proyecto: MNIST con MLP.
- **Semana 12**: Optimización (SGD, Adam), regularización (dropout, batchnorm).
- Proyecto: comparar con/sin dropout.
- **Semana 13**: CNN.
- Proyecto: Cats vs Dogs.
- **Semana 14**: Transfer Learning (ResNet, MobileNet).
- Proyecto: clasificador de imágenes con modelo preentrenado.
- **Semana 15**: RNN y LSTM.
- Proyecto: predicción de texto carácter a carácter.
- **Semana 16**: Word embeddings (Word2Vec, GloVe).
- Proyecto: clasificador de reviews de Amazon.
- **Semana 17**: Transformers (BERT).
- Proyecto: clasificación de texto con BERT.
- **Semana 18**: Proyecto integrador: Chatbot Django + Transformers.
---
# 🔹 Módulo 4 — IA Generativa, NLP Avanzado y Forecasting (3 meses)
- **Semana 19**: Prompt engineering + LangChain.
- Proyecto: chatbot con prompts dinámicos.
- **Semana 20**: Fine-tuning ligero (LoRA, PEFT).
- Proyecto: clasificador de documentos PDF.
- **Semana 21**: Stable Diffusion.
- Proyecto: generador de logotipos.
- **Semana 22**: Text-to-SQL + búsqueda semántica (pgvector, FAISS).
- Proyecto: buscador inteligente sobre BD.
- **Semana 23**: Forecast de demanda (ETS/ARIMA, walk-forward).
- Proyecto: motor de predicción de compras.
- **Semana 24**: Integración Django + Vue + API IA.
- Proyecto: dashboard interactivo.
---
# 🔹 Módulo 5 — MLOps y Producción (3 meses)
- **Semana 25**: Docker para ML.
- Proyecto: contenedor reproducible.
- **Semana 26**: FastAPI + ONNX Runtime.
- Proyecto: API de predicciones.
- **Semana 27**: Kubernetes (minikube/k3d).
- Proyecto: despliegue cluster local.
- **Semana 28**: MLflow + DVC.
- Proyecto: versionado de modelos.
- **Semana 29**: CI/CD con GitHub Actions.
- Proyecto: pipeline automático.
- **Semana 30**: Proyecto final en Cloud (AWS/GCP/Azure).
- Entrega: API IA escalable en producción.
---
# 🤖 Tipos de IA que dominarás
1. **ML clásico**: regresión, árboles, boosting.
2. **DL**: MLP, CNN, RNN.
3. **Transformers/LLMs**: BERT, GPT, LoRA.
4. **Generative AI**: Stable Diffusion, text-to-image.
5. **RAG**: Retrieval-Augmented Generation.
6. **Recomendadores**: embeddings, colaborativos.
7. **Forecasting**: ARIMA, Croston, Holt-Winters.
8. **MLOps**: Docker, FastAPI, K8s, MLflow, CI/CD.
---
# 📂 Librerías y ecosistema (2025)
- **Datos**: NumPy, pandas, Polars, DuckDB.
- **ML clásico**: scikit-learn, XGBoost, LightGBM, CatBoost.
- **DL**: PyTorch, TensorFlow/Keras, timm, TorchMetrics, Lightning.
- **Visión**: OpenCV, Albumentations, YOLO.
- **NLP/LLMs**: Hugging Face (Transformers, Datasets), spaCy, SentencePiece, vLLM, TGI, llama.cpp.
- **RAG**: FAISS, pgvector, Qdrant, LangChain, LlamaIndex.
- **Calidad/monitoreo**: Evidently, Great Expectations, Ragas, Langfuse.
- **Serving**: FastAPI, ONNX Runtime, NVIDIA Triton, BentoML.
- **MLOps**: MLflow, DVC, Prefect/Airflow, KServe.
- **Web/móvil**: Transformers.js, TensorFlow.js, TFLite, ML Kit.
---
# 📘 Recursos recomendados
- **Libros**
- *Hands-On Machine Learning* (Géron).
- *Deep Learning* (Goodfellow).
- *Practical Statistics for Data Scientists*.
- *Forecasting: Principles and Practice* (Hyndman).
- **Cursos**
- Andrew Ng — *Machine Learning Specialization* (Coursera).
- Hugging Face — *NLP with Transformers*.
- Fast.ai — *Practical Deep Learning*.
- **YouTube**
- [3Blue1Brown](https://www.3blue1brown.com/) (matemáticas visuales).
- [StatQuest](https://www.youtube.com/user/joshstarmer) (ML y estadística clara).
- [Sentdex](https://www.youtube.com/user/sentdex) (PyTorch práctico).
- **Repos**
- [Scikit-learn examples](https://scikit-learn.org/stable/auto_examples/index.html).
- [PyTorch tutorials](https://pytorch.org/tutorials/).
- [Hugging Face Transformers](https://huggingface.co/docs/transformers/index).
- [LangChain docs](https://python.langchain.com/).
---
# ✅ Checklist de avance
- [ ] Módulo 0 — Matemáticas esenciales.
- [ ] Módulo 1 — Fundamentos.
- [ ] Módulo 2 — ML clásico.
- [ ] Módulo 3 — Deep Learning.
- [ ] Módulo 4 — Generativa + Forecasting + NLP avanzado.
- [ ] Módulo 5 — MLOps.
- [ ] Proyecto final desplegado en Cloud.
---
# 📌 Pro Tip
Este README es tu **contrato de aprendizaje**:
- Cada semana entrega un **notebook + README del proyecto**.
- Sube *screenshots* y métricas a `/reports`.
- Documenta un **post-mortem** corto: qué aprendiste y qué mejorarás.
---