RAG (Retrieval-Augmented Generation)
RAG es la técnica de IA donde el modelo busca primero en TUS documentos antes de responder. Permite hacer chatbots que saben de tu negocio sin necesidad de fine-tuning.
Explicación
RAG resuelve el problema de "ChatGPT no sabe nada de mi empresa". Funciona en 3 pasos: (1) indexar tus documentos en una base vectorial con embeddings; (2) cuando llega una pregunta, buscar los 3-5 documentos más relevantes; (3) pasar esos documentos al LLM como contexto y pedirle que responda. Más fiable, más barato y más actualizable que fine-tuning. Stack típico: pgvector + OpenAI embeddings + Claude o GPT-4. Coste mensual para una pyme con 1.000 docs y 500 consultas/día: ~10-30€.
Caso real
Para la academia de idiomas implementé RAG sobre su FAQ + manual del alumno. El chatbot responde correctamente "¿qué pasa si pierdo una clase?" o "¿cuándo empieza el ciclo de C1?" sin que nadie haya entrenado el modelo. Solo le pasa los documentos relevantes.