Embeddings
Embeddings convierten texto (o imagen, audio) en vectores numéricos donde lo semánticamente parecido queda cerca. Permiten búsqueda inteligente: encontrar texto similar, no solo coincidencia exacta.
Explicación
Un embedding es un array de 1.536 números (en text-embedding-3-small de OpenAI) que representa el significado de un texto. Frases similares producen vectores cercanos. Casos prácticos: búsqueda semántica ("¿dónde dije algo de proveedores?" funciona aunque uses sinónimos), recomendaciones ("artículos similares a este"), clustering automático ("agrupa estas 500 quejas por tema"). Cuesta ~0.02$ por millón de tokens — para una pyme con miles de docs, indexar todo cuesta < 5€. Almacenamiento: pgvector en Postgres (gratis con Supabase) o Pinecone, Weaviate.
Caso real
Para una asesoría con 800 procedimientos en PDF, indexé todos con embeddings. Antes una secretaria tardaba 20 min buscando un documento; ahora la búsqueda devuelve resultados relevantes en 200ms. ROI: 2 meses.