🧠IA

RAG (Retrieval-Augmented Generation)

Respuesta directa

RAG es la técnica de IA donde el modelo busca primero en TUS documentos antes de responder. Permite hacer chatbots que saben de tu negocio sin necesidad de fine-tuning.

Explicación

RAG resuelve el problema de "ChatGPT no sabe nada de mi empresa". Funciona en 3 pasos: (1) indexar tus documentos en una base vectorial con embeddings; (2) cuando llega una pregunta, buscar los 3-5 documentos más relevantes; (3) pasar esos documentos al LLM como contexto y pedirle que responda. Más fiable, más barato y más actualizable que fine-tuning. Stack típico: pgvector + OpenAI embeddings + Claude o GPT-4. Coste mensual para una pyme con 1.000 docs y 500 consultas/día: ~10-30€.

Caso real

Para la academia de idiomas implementé RAG sobre su FAQ + manual del alumno. El chatbot responde correctamente "¿qué pasa si pierdo una clase?" o "¿cuándo empieza el ciclo de C1?" sin que nadie haya entrenado el modelo. Solo le pasa los documentos relevantes.

Calcular mi presupuesto Hablar primero