Alex Holt (ElevenLabs): «El modelo puede ser excelente, pero sin contexto dará respuestas que no resuelven nada»

ElevenLabs en Current 2026: por qué los agentes de IA funcionan en demo y fallan en producción, y qué hace falta para cerrar esa brecha.

Alex Holt, Head of Forward Deployed Engineering en ElevenLabs

Editor en La Ecuación Digital. Analista y divulgador tecnológico con…

En 2019, Google presentó en su conferencia anual una demo que dejó a la audiencia sin palabras. Un agente de voz llamaba a una peluquería, mantenía una conversación completamente natural con la persona al otro lado de la línea y reservaba una cita. Era convincente, fluido, casi indistinguible de una llamada humana, pero nunca llegó a convertirse en un producto real.

Alex Holt, Head of Forward Deployed Engineering en ElevenLabs, lo usó como punto de partida en su conversación con Sean Falconer en Current 2026. No lo hizo para criticar a Google, sino para señalar algo que define la situación del sector en 2026: la distancia entre lo que es posible en una demo y lo que funciona en producción sigue siendo enorme, y la mayoría de las organizaciones la descubre tarde.

Por qué la voz lo hace visible

ElevenLabs construye agentes de voz para atención al cliente, ventas, formación y videojuegos. Es un territorio donde el margen de error es pequeño y los fallos son inmediatos.

«La latencia es obvia en la voz. Si estás hablando con alguien y tarda en responder, suena raro. Si llamas a atención al cliente y el agente no te responde en tiempo real, vas a buscar la opción de hablar con una persona.»

Esto convierte los agentes de voz en una superficie de prueba exigente para cualquier arquitectura de datos. En un chatbot de texto, un segundo de retraso es molesto; en una conversación de voz, acaba con la interacción. El problema no está solo en la latencia del modelo de voz, sino en la latencia del contexto que ese modelo necesita para decir algo útil.

Un agente que atiende una llamada de soporte necesita saber quién llama, qué productos tiene contratados, cuál fue su última interacción y si hay alguna incidencia abierta. Todo eso tiene que estar disponible en milisegundos, no en segundos. En la mayoría de las organizaciones, esa información vive en sistemas que no están diseñados para servir contexto a esa velocidad.

«El modelo puede ser excelente. Pero si le falta el contexto sobre el cliente, sobre los procedimientos internos, sobre el estado actual del producto, va a dar respuestas que suenan bien y no resuelven nada. O peor, que resuelven algo que no debería resolver.»

El abismo entre demo y producción

Lo que Holt describe como el mayor error que cometen las organizaciones es de expectativas, no técnico.

La demo funciona porque está controlada. Los datos son los correctos, el escenario está acotado y el agente hace exactamente lo que se le ha pedido que haga en ese contexto específico. En producción, el agente se enfrenta al desorden real: clientes con historiales complejos, preguntas fuera del guion, datos inconsistentes entre sistemas y casos que nadie anticipó.

«Llevamos la IA a producción con la misma mentalidad con la que hacemos la demo. Y luego nos sorprende que no funcione igual.»

La solución que propone ElevenLabs para sus propios clientes pasa por tratar los agentes como código en el sentido más estricto: versionado, testing, CI/CD y monitorización en producción. No como una configuración que se activa y se deja correr, sino como un sistema que se itera continuamente a medida que se recogen datos reales de uso.

«No existe un botón que lo haga funcionar. Requiere tiempo, recursos de desarrollo y herramientas que soporten ese ciclo completo. Si tienes eso, puedes construir agentes de nivel empresarial hoy. Si esperas que funcione solo, vas a tener otro demo que no llega a producto.»
Te puede interesar

Actualidad

Bezos en VivaTech: cuando la IA deja de ser software y se convierte en infraestructura industrial

El contexto como problema de infraestructura

La conversación entre Holt y Falconer en el escenario de Current 2026 terminó convergiendo en un punto que recorre todo el evento: el problema de los agentes de IA en producción está en el contexto, no en el modelo.

Los modelos fundacionales disponibles hoy son suficientemente buenos para la mayoría de los casos de uso empresariales. Lo que les falta no es capacidad de razonamiento general, sino conocimiento específico del negocio: los procedimientos internos, el historial del cliente y el estado actual de los sistemas. Eso no viene en el modelo. Viene de la infraestructura de datos de la organización.

Y esa infraestructura, en la mayoría de los casos, no está preparada para servirlo en tiempo real. Los datos existen, pero llegan tarde, están en silos o requieren un proceso de transformación que introduce latencia suficiente para hacer inviable el caso de uso.

Es el mismo problema que Jay Kreps planteó en la keynote desde el ángulo de la arquitectura. ElevenLabs lo ilustra desde el ángulo del usuario final: cuando el agente tarda o dice algo que no tiene sentido, el usuario cuelga. La latencia del dato se convierte en pérdida de negocio de forma directa y medible.

Esta pieza forma parte de la cobertura de La Ecuación Digital desde Current 2026 en Londres.

Etiquetas

agentes de ia Confluent current2026 elevenlabs

Hernán Rodríguez

Editor en La Ecuación Digital. Analista y divulgador tecnológico con más de 30 años de experiencia en el estudio del impacto de la tecnología en la empresa y la economía.