AI ENGINEERING / PRODUCCIÓN Y GOBERNANZA

Producción y gobernanza

Shipear y operar IA: costo, latencia, guardrails, PII y seguridad, human-in-the-loop, accountability, y deployment. La brecha entre una demo y una IA que corre el lunes a la mañana.

Fundamento · 2

Nota de producción
Gotchas de producción: lo que la demo nunca te mostró
Una demo prueba que un sistema de IA puede funcionar una vez. Producción prueba que funciona el lunes a la mañana, bajo carga, con los inputs que nadie guionó, cuando la factura de tokens es real y el agente puede borrar cosas. La brecha entre las dos es donde se rompen los sistemas de IA — no en capacidad, sino en el techo de costo que nadie puso, la latencia que nadie presupuestó, la inyección de prompt que nadie filtró, la PII que se fue a un tercero, la acción irreversible sin paso de aprobación, y el kill switch que no existía cuando hizo falta. Diez gotchas que separan una demo de un sistema que podés correr, cada uno con la trampa, el arreglo, y la pregunta a contestar antes de lanzar.
Marco de decisión
Style Guide de producción: la compuerta que una IA pasa antes de correr sin supervisión
Las reglas con opinión que Cleon aplica antes de que un sistema de IA corra sobre tráfico real — la compuerta pre-ship como una checklist binaria (techo de costo, fallback de latencia, guardrail de entrada, PII enmascarada, un humano en las acciones irreversibles, el audit trail prendido, un rollback listo, la compuerta de eval pasada), y la matriz en-plataforma-versus-construirlo que dice qué te dan Agentforce y el Einstein Trust Layer por construcción versus qué armás off-platform, dimensión por dimensión. El documento de disciplina que convierte los gotchas de producción en reglas y los principios de production readiness en una checklist: una fila sin cumplir bloquea el ship. Y como esta es la última página del catálogo de AI Engineering, ata las cinco subcategorías — agentes, grounding, prompting, evaluación, producción — en el único arco que toda la disciplina recorre.

Referencia · 5

Cómo hacerlo · 1

Cómo hacerlo
Deployar a producción: el camino seguro de un eval que pasa al tráfico vivo
El eval está verde — ¿y ahora cómo lo lanzás de verdad sin aprender por las malas que verde offline no es verde en producción? Seis pasos que llevan un cambio de prompt, model o agente de un test que pasa al tráfico vivo con una vuelta atrás: construir y testear en un entorno aislado (Agentforce DX mueve metadata de agentes entre scratch orgs, sandboxes y prod; off-platform, un entorno de staging), pasar el gate de eval antes del merge, versionar el cambio para saber exactamente qué se lanzó, hacer un rollout gradual detrás de un canary en vez de dar vuelta el 100 por ciento de una, tener un rollback de un paso listo, y monitorear sobre tráfico vivo después — porque la degradación silenciosa que un set congelado no puede ver la caza el eval online y el tracing. El hilo: el deployment no es la línea de llegada. Es donde la evaluación y la observabilidad empiezan a hacer su trabajo de verdad.

Producción y gobernanza

Fundamento · 2

Gotchas de producción: lo que la demo nunca te mostró

Style Guide de producción: la compuerta que una IA pasa antes de correr sin supervisión

Referencia · 5

¿Qué es production readiness? La brecha entre una demo que funciona y una IA que corre el lunes

Costo y latencia: las palancas, en orden de fuerza

Guardrails de entrada y salida: la capa de seguridad alrededor de un agente shipeado

PII y gobernanza de datos: masking, retención, y el audit trail

Human-in-the-loop y accountability: quién responde cuando el agente actúa

Cómo hacerlo · 1

Deployar a producción: el camino seguro de un eval que pasa al tráfico vivo