AI ENGINEERING / GROUNDING Y RECUPERACIÓN
Grounding y recuperación
Conectar los modelos a tu conocimiento: RAG bien hecho — chunking, embeddings, calidad de retrieval — entre los retrievers de Agentforce sobre Data 360 y vector stores externos. La base sobre la que se paran las respuestas de un agente.
Fundamento · 2
Nota de producción
Gotchas de grounding: cómo falla el retrieval en producción
Una demo de RAG recupera el único documento que probaste, sobre la única pregunta que hiciste. Producción recupera de todo lo que tenés, sobre preguntas que nadie guionó — y el chunk equivocado es una respuesta equivocada con seguridad. Diez gotchas que matan el grounding después de la demo, cada uno con la pregunta que tenés que contestar primero y el costo de equivocarte.
Marco de decisión
Style Guide de grounding: la vara que el retrieval pasa antes de salir
Las reglas con opinión que Cleon aplica a cada sistema groundeado — la primera decisión (¿necesitás retrieval siquiera?), la vara de retrieval quality que un pipeline pasa antes de salir, y cómo componemos los retrievers de Agentforce y el RAG externo según dónde viven los datos en vez de elegir un bando. El documento de disciplina que convierte los gotchas de grounding en una vara y los principios en práctica, puntuando el retrieval antes de que nadie toque el prompt.
Referencia · 5
Referencia
¿Qué es grounding? El pipeline de retrieval sobre el que se para una respuesta
Grounding es alimentar al modelo con hechos reales recuperados en vez de dejar que responda desde el entrenamiento — y RAG, retrieval-augmented generation, es cómo se construye. El pipeline de punta a punta: chunk → embed → store → retrieve → augment → generate, cada etapa en una oración. El vocabulario que usa el resto de esta subcategoría — chunk, embedding, vector store, semantic search, hybrid search, top-k, re-ranking — y el test honesto para saber cuándo necesitás retrieval: solo cuando la respuesta vive en datos para los que el modelo no fue entrenado o que cambian. Principio 2: groundeá antes de generar.
Referencia
Chunking y embeddings: los inputs de los que depende la calidad del retrieval
Las dos palancas de upstream sobre las que se para la calidad del retrieval: chunking y embeddings. Cómo partís un documento — fixed-size, estructural, semántico — y los trade-offs de tamaño de chunk y overlap que preservan o destruyen el sentido, incluido el Contextual Retrieval de Anthropic. Qué es un embedding, por qué el modelo de embedding es una decisión real (dimensión, costo, latencia, fit de dominio), y por qué query y documento tienen que compartir un mismo modelo. Anthropic no tiene un modelo de embedding propio — pareás Claude con un proveedor. Equivocate acá y ningún ajuste de retrieval te salva.
Referencia
Calidad de retrieval: medir y mejorar lo que recibe el modelo
La calidad del retrieval es una cosa separada de la calidad de la respuesta, y la tenés que medir por su cuenta. Esta página separa las dos — cómo puntuar si el chunk correcto volvió o no y qué tan alto rankeó, con un eval set de retrieval chico armado query-a-chunk — y después recorre las palancas que la mejoran: hybrid search, re-ranking, metadata filtering, query rewriting, y el tuneo de chunk/k, cada una con dónde encaja y qué cuesta. El hilo: un sistema fundamentado es tan bueno como su retrieval, y el retrieval solo es confiable una vez que se mide.
Referencia
Retrievers de Agentforce: grounding dentro de la plataforma Salesforce
El camino de grounding nativo de la plataforma: un retriever envuelve una operación de Einstein Search y hace de puente entre un search index y tus Prompt Templates y Flow, así un agente de Agentforce responde sobre Data 360 en vez de suponer. Cómo se arma — el retriever que Data 360 auto-crea por índice frente a uno custom en Einstein Studio, los tipos de search index vector y hybrid, retrievers no-code para admins frente a custom para control, ensemble retrievers que cruzan fuentes — y la parte que le gana a la plataforma su lugar: el retrieval corre dentro del modelo de seguridad de Salesforce, honrando los permisos del usuario que corre por construcción. La línea complementaria con un pipeline de RAG externo (principio 7), y el modelo de Data 360 limpio que tiene que venir primero.
Referencia
RAG externo: el pipeline de grounding que controlás vos
El camino de grounding fuera de la plataforma como un pipeline que construís etapa por etapa — LangChain para orquestarlo, un vector store que corrés vos, un proveedor de embeddings emparejado con Claude, y la Claude API para la generación. Lo que lo define: cuando el corpus vive fuera de Salesforce, sos dueño del chunking, del índice, del tuning de retrieval, del filtro de permisos, del contrato de frescura y del set de eval que los retrievers de Agentforce te dan gratis. La decisión correcta cuando los datos y el trabajo están fuera de la plataforma — y complementaria al camino de la plataforma, no rival de él.