Deja de Adivinar, Empieza a Medir
Armar un demo de RAG que funcione es relativamente fácil. Mantenerlo confiable en producción es otro cuento. Este programa le da a tu equipo un proceso estructurado y basado en métricas para identificar qué está fallando, corregirlo con cambios puntuales y verificar los resultados, una y otra vez.
El RAG Flywheel
Todo en esta formación gira alrededor de un solo ciclo:
- Medir: definir cómo se ve un buen retrieval y generar datos sintéticos de evaluación para probarlo
- Analizar: meterse en los resultados para entender exactamente dónde y por qué el sistema se queda corto
- Mejorar: aplicar cambios enfocados como mejor chunking, fine-tuning de embeddings, búsqueda híbrida y routing
- Iterar: incorporar feedback real de usuarios, actualizar los benchmarks y volver a correr el ciclo
Cada módulo recorre una pieza de este loop con ejercicios prácticos que tu equipo puede aplicar directamente a su propio sistema.
Basado en Escenarios Reales de Producción
A lo largo del programa trabajamos con ejemplos documentados donde equipos llevaron sistemas RAG de prototipos poco confiables a herramientas de producción robustas. Vas a ver cómo decisiones guiadas por evaluación (no por intuición) impulsaron cada ronda de mejora, y podrás aplicar los mismos patrones con tus propios datos.
Qué Incluye
- Notebooks de Python hands-on alineados a cada módulo para que los participantes practiquen cada concepto de inmediato
- Office hours en vivo para resolver dudas, revisar arquitecturas y hacer Q&A
- Clases complementarias que se pueden volver a ver en cualquier momento después del programa
- Herramientas estándar de la industria: OpenAI, Anthropic, Google Gemini, Cohere, Qdrant, sentence-transformers, Instructor, Langfuse, Promptfoo, Opik, entre otras
Metodología
- Basado en proyecto: los participantes trabajan sobre un reto real de mejora de RAG durante todo el programa
- Evaluación primero: cada cambio propuesto se mide antes y después
- Agnóstico de framework: las técnicas aplican sin importar tu base de datos vectorial o proveedor de LLMs
- Colaborativo: office hours y revisión entre pares mantienen el aprendizaje aterrizado en problemas reales
Modalidades
- Estándar (4 semanas): un día de clase por semana + office hours y soporte al día siguiente
- Intensivo (2 semanas): sesiones en la mañana + soporte en la tarde todos los días
Prerequisitos
- Haber construido o desplegado al menos un sistema RAG básico (nivel prototipo está bien)
- Conocimiento práctico de Python
- Familiaridad con APIs de LLMs y bases de datos vectoriales