Gotchas de IA en Marketing Cloud: dónde te muerden Einstein, Agentforce y los modelos externos

"IA en Marketing Cloud" no es una sola cosa. Son tres, y fallan de tres formas distintas. Einstein son features dentro de la plataforma — Engagement Scoring, Send Time Optimization, Content Selection, Copy Insights — y su modo de falla es silencioso: un modelo entrenado con la data equivocada puntúa con seguridad y mal. Agentforce entra desde el lado de la plataforma de Salesforce, fundamentado en Data Cloud, y su modo de falla es el modelo de datos por debajo. La IA externa — un LLM que llamás vos desde un CloudPage o SSJS — falla como falla cualquier llamada a una API externa, más las formas en que falla un modelo no determinístico encima.

Diez gotchas a través de las tres superficies, sintetizados de los builds de Marketing Cloud de Cleon, la guía oficial de Salesforce, y las correcciones que la comunidad de practitioners aprendió a los golpes. Cada uno viene con la pregunta a responder antes de publicar y el costo de equivocarte. El encuadre no es "cuál es la respuesta correcta" — es "cuál es la pregunta que tenés que estar listo para defender".

Los gotchas

1. Los scores de Einstein valen lo que la historia de engagement por debajo — una historia delgada puntúa ruido

Einstein Engagement Scoring y Send Time Optimization aprenden de la historia real de aperturas, clicks y conversiones de tu tenant. En una Business Unit con meses de envíos consistentes, los scores significan algo. En una BU nueva, un programa de bajo volumen, o un contacto con tres envíos en su vida, el modelo está extrapolando de casi nada — y reporta un score igual, sin ningún flag de confianza en la UI.

El costo es una campaña optimizada sobre ruido que parece optimizada sobre señal. Antes de dejar que Einstein maneje el send time o la selección de audiencia, respondé: ¿esta Business Unit tiene suficiente historia de engagement, para estos contactos, para que el score signifique algo? Si no, el score es decoración.

2. Send Time Optimization mueve el envío — asegurate de que el journey tolere la dispersión

STO no envía a la hora que programaste; envía a la hora que predice que cada contacto engancha, lo que puede dispersar un solo envío a lo largo de una ventana de 24 horas. Ese es el punto. Pero también significa que un envío sensible al tiempo — una flash sale que termina a medianoche, un recordatorio de un evento de las 9am — puede aterrizar después de que pasó el momento para los contactos que STO decidió que enganchan mañana a la mañana.

El costo es un recordatorio que llega después del evento. La pregunta: ¿el valor de este envío es estable a lo largo de una dispersión de 24 horas, o tiene una deadline dura que STO va a errar feliz?

3. Content Selection y Copy Insights son sugerencias, no aprobaciones — un humano sigue siendo dueño de lo que sale

Einstein Content Selection elige el asset que mejor rinde por contacto; Copy Insights predice el rendimiento de un subject line. Las dos son genuinamente útiles y las dos son consultivas. Tratar a cualquiera como un paso de aprobación — publicar automáticamente la elección de la IA sin lectura humana — es cómo un subject line sordo o una imagen fuera de marca llega a un millón de inboxes sin el nombre de nadie encima.

El costo es un error de marca a escala de envío que nadie eligió. La pregunta a responder una vez, como política: ¿dónde en el workflow un humano aprueba lo que Einstein sugirió, y esa puerta está impuesta o apenas sugerida?

4. Agentforce vale lo que el modelo de Data Cloud por debajo — un modelo fragmentado fundamenta un agente seguro y equivocado

Un agente de Agentforce que responde preguntas sobre un cliente lee el perfil unificado en Data Cloud. Si la identidad no resuelve, las relaciones no están modeladas, y los objetos no están documentados, el agente hereda el mismo desastre fragmentado que heredaría un analista humano — y a diferencia del analista, responde con seguridad igual. "Agent-ready" no es un estado al que llegás prendiendo Agentforce; es el estado en el que el modelo de datos ya está, o no está.

El costo es un agente seguro y equivocado, que es peor que uno que dice que no sabe. La pregunta honesta, antes de apuntarle Agentforce a la data de marketing: ¿un analista humano puede sacar hoy una respuesta coherente y completa sobre un cliente del perfil unificado? Si no, el agente tampoco. (Ver los gotchas de arquitectura de Data Cloud.)

5. Un agente que puede actuar necesita los mismos guardrails que una automation que puede enviar

En el momento en que un agente puede hacer más que responder — disparar un journey, actualizar un registro, mandar un mensaje — es una automation con un trigger no determinístico. Todos los guardrails que le pondrías a una Send Definition o a una Automation aplican: quién aprobó la acción, cuál es el radio de explosión, dónde está el audit trail, cómo la frenás. La novedad de la interfaz no suspende la disciplina.

El costo es un agente tomando una acción a escala que ningún humano firmó. La pregunta: para cada acción que el agente puede tomar, ¿cuál es la puerta de aprobación, el rate limit, y el kill switch — los mismos tres que le exigirías a cualquier automation que toca a un cliente?

6. Llamar a un LLM externo desde un CloudPage mete a un tercero en tu camino de envío — y quizás tu data en sus logs

Cuando llamás a un modelo externo desde SSJS — para generar copy, clasificar una respuesta, resumir un registro — agregaste una dependencia de red a una superficie que puede correr en tiempo de envío, y quizás estés mandando data de clientes a un tercero que la loguea. Las dos cosas importan. La de latencia rompe páginas; la de data es una exposición de compliance que un DPA cubre o no cubre.

7. Una llamada a un modelo externo en render time es un punto único de falla para toda la página

HTTPRequest en SSJS es sincrónica y puede timeout. Si un CloudPage o la lógica de render-time de un email llama a un modelo externo y el proveedor está lento o caído, la página se cuelga o da error para el visitante — la latencia del modelo ahora es la latencia de tu página, y la caída del modelo es tu caída. El render time es el peor lugar para descubrir el p99 de un proveedor.

El costo es una página rota atada al uptime de otro. La pregunta: ¿esta llamada pasa en render time (donde toda falla es visible para el usuario) o antes de tiempo en una Automation (donde una falla es tuya para atrapar y reintentar)? Default a antes-de-tiempo. (Ver llamar a IA externa desde CloudPages.)

8. Un modelo no determinístico en un envío determinístico es un problema de QA que no podés resolver con muestreo

El QA de email asume que el mismo input produce el mismo output: previsualizás, se ve bien, enviás. Un LLM rompe ese supuesto — el mismo prompt puede producir copy distinto en dos llamadas, y el único output malo es el que una muestra de tres previews no va a atrapar. Copy generado que está mal, fuera de marca, o no seguro no se anuncia en un spot check.

El costo es un mensaje generado que nunca previsualizaste llegando a un contacto real. La pregunta: ¿el output del modelo está restringido y validado antes de salir — un set fijo de opciones, una aprobación humana, un filtro de contenido — o estás confiando en que una muestra representa a una distribución?

9. El costo del modelo escala con tu envío, y no hay throttle incorporado

Una llamada a un modelo externo facturada por token, disparada una vez por contacto en un journey de un millón de envíos, es un millón de llamadas — y la factura, y el rate limit, escalan con la audiencia. Marketing Cloud no te va a avisar; va a disparar el SSJS un millón de veces feliz. El rate limit del proveedor va a empezar a devolver errores a mitad de camino, dejando un envío personalizado a medias.

El costo es una factura desbocada o un envío fallado a medias, descubierto después del hecho. La pregunta: ¿el costo por contacto y el rate limit están modelados contra el tamaño real de la audiencia, con un throttle y un fallback para cuando pega el límite? (Generá antes de tiempo, cacheá el resultado, y el costo por envío se va a cero.)

10. "Lo hizo la IA" no es una respuesta que un regulador o un cliente acepte

Sea Einstein seleccionando una audiencia, Agentforce tomando una acción, o un modelo externo escribiendo copy, la responsabilidad no se muda al modelo. Una audiencia discriminatoria, una afirmación falsa en copy generado, una acción tomada sobre el cliente equivocado — la consultora y el cliente la poseen, igual que cualquier otra decisión de producción. El modelo es una herramienta de la que el equipo es responsable, no una parte que comparte la culpa.

El costo es reputacional y a veces legal, y aterriza sobre el equipo humano sin importar qué superficie lo produjo. La pregunta, antes de que cualquier superficie de IA toque a un cliente: ¿quién es responsable de lo que produce, y puede explicarlo y defenderlo? Si la respuesta es "la IA", falta la respuesta.

El hilo a través de los diez: la IA en Marketing Cloud no suspende las disciplinas que la plataforma ya enseñó. Los scores de Einstein necesitan el mismo escepticismo que cualquier modelo — historia basura, score basura. Agentforce necesita el mismo modelo de datos limpio que cualquier analista, más los guardrails de acción de cualquier automation. La IA externa necesita el mismo trato que cualquier dependencia externa — presupuesto de latencia, manejo de fallas, un acuerdo de datos — más la disciplina de QA que exige un output no determinístico. La novedad está en la capacidad, no en el criterio de ingeniería.

Cierre

Estos diez son las fallas de IA-en-Marketing-Cloud que Cleon vio morder más fuerte, o vio venir. El tema compartido es el que la plataforma siempre enseña: el camino fácil hace funcionar la demo, y el camino durable hace que sobreviva un millón de envíos. Confiar en un score de Einstein de historia delgada, publicar automáticamente un subject line generado, llamar a un modelo en render time, disparar una llamada por token una vez por contacto sin throttle — ninguno es difícil en el momento, y cada uno es un post-mortem una vez que está vivo.

La disciplina que previene la mayoría es la misma que previene las versiones de SQL y Config: un humano responsable de lo que la IA produce, el modelo de datos chequeado antes de que el agente lo lea, y la llamada externa tratada como la dependencia externa que es.

Si un gotcha de IA-en-Marketing-Cloud mordió a tu equipo y no está acá, escribí a hello@wearecleon.com — lo agregamos, con crédito.

Referencia: