Editor en La Ecuación Digital. Analista y divulgador tecnológico con…
Hay una diferencia entre tener un argumento y tener el producto que lo sostiene. Confluent lleva tiempo con el argumento. En Current 2026, celebrado la semana poasada en Londres, llegó el producto.
El anuncio central de la keynote fue la disponibilidad general de Confluent Intelligence, que agrupa tres capacidades que hasta ahora estaban en acceso anticipado. Pero alrededor de ese anuncio hubo otros que completan la imagen de hacia dónde va la plataforma y qué resuelve en la práctica para equipos de ingeniería que intentan construir sistemas de IA que funcionen más allá de las demos.
Lo que hace Confluent Intelligence en la práctica
El primer componente es el Real-Time Context Engine. El problema que resuelve es concreto: cuando un agente necesita contexto para tomar una decisión, las consultas sobre datos almacenados en object storage son lentas. Demasiado lentas para servir contexto en tiempo real. El Context Engine añade una capa de caché en memoria y SSD que convierte esas consultas en respuestas de milisegundos. El agente emite SQL estándar y obtiene datos vivos sin acceder directamente a sistemas de producción.
El segundo son los Streaming Agents en Flink. No es un asistente conversacional sino un trabajador en segundo plano: observa un stream de eventos de negocio, evalúa, decide y actúa. Cuando ocurre algo en el flujo, el agente puede invocar un modelo de lenguaje, ejecutar una acción, producir un evento de salida. Una de sus ventajas más relevantes para equipos de desarrollo es que el mismo job que corre en producción sobre datos en tiempo real puede ejecutarse sobre snapshots históricos, lo que permite comparar resultados con distintos modelos o distintos conjuntos de contexto sin tocar el entorno productivo.
El tercero son las funciones de machine learning integradas directamente en Flink. Detección de anomalías, forecasting, detección de fraude. Sin necesidad de gestionar modelos externos ni presupuesto de tokens. Para casos de uso de alto volumen donde no se necesita razonamiento complejo sino detección de patrones, un modelo clásico bien ajustado es más barato, más rápido y más predecible que un LLM.
Los tres componentes tienen lógica como sistema: el ML clásico filtra el ruido en el stream de alta frecuencia, identifica los casos que merecen atención, y solo entonces invoca al agente con LLM, que consulta el Context Engine para obtener el contexto necesario. Todo dentro del mismo sistema.
El problema de escala que nadie está resolviendo todavía
Steffen Hoellinger llegó a Confluent hace ocho meses como Field CTO para EMEA, tras vender a la compañía Airy, una startup que construía infraestructura de datos para agentes de IA. En conversación con La Ecuación Digital en Londres, su perspectiva sobre los anuncios del día parte de una observación que va más allá del producto.
Gartner publicó hace dos semanas una estimación que sitúa en 150.000 el número medio de agentes que tendrá una empresa Fortune 500 para 2028. Hoellinger es directo sobre lo que eso implica: las arquitecturas actuales no van a escalar hasta ahí.
«Si tienes una docena de agentes, puedes tener uno llamando al otro directamente. Cuando tienes miles, eso se rompe. Es casi imposible mantener qué agente hace qué cuando hay tanto solapamiento entre ellos.»
La respuesta que propone Confluent no es un orquestador central que coordine todos los agentes. Es una arquitectura event-driven donde los agentes reaccionan a eventos del stream sin necesitar coordinación directa entre sí. Hoellinger lo describe como una combinación necesaria: la orquestación activa para los agentes complejos que los equipos construyen deliberadamente, y la arquitectura orientada a eventos para la larga cola de agentes más simples que monitorean procesos, detectan anomalías y disparan acciones en respuesta.
«Habrá agentes complejos modelados sobre flujos de trabajo humanos, y habrá una cola larga de agentes que son básicamente Flink jobs haciendo una sola cosa de forma continua. Pueden no invocar ningún modelo de lenguaje, solo procesamiento de eventos para filtrar patrones y disparar acciones.»
Por qué el batch ya no es suficiente
La conversación con Hoellinger ofrece un ejemplo que ilustra mejor que cualquier benchmark por qué el procesamiento en batch tiene los días contados para casos de uso con IA. Hace unas semanas habló con una startup que construye software para ensayos clínicos. Sus procesos batch actuales tardan dos horas en completarse. Cada vez que llega un nuevo dato, el sistema tarda dos horas en reflejar el nuevo estado.
«Ya saben que no pueden seguir así. Son una empresa temprana y ya tienen que adoptar streaming como forma de trabajar continuamente con los datos.»
El argumento que desarrolla Hoellinger para organizaciones de cualquier tamaño parte de una premisa que parece obvia pero tiene consecuencias prácticas importantes: no hay ninguna buena razón para mover datos a un data lake y procesarlos horas después si el mismo procesamiento puede hacerse de forma continua más cerca del origen. La eficiencia no es el único beneficio. En entornos con agentes tomando decisiones automatizadas, el linaje del dato se vuelve un requisito de cumplimiento, no una preferencia técnica.
«En servicios financieros, si tienes un agente que decide si alguien obtiene una hipoteca, tienes que poder documentar qué datos usó, de dónde venían y qué política estaba vigente en ese momento. Kafka como log append-only te da esa trazabilidad de forma nativa.»
Los anuncios que reducen la fricción de adopción
Junto a Confluent Intelligence, hubo tres anuncios orientados a eliminar barreras de entrada concretas.
KCP, Kafka Copy Paste, resuelve la migración de infraestructuras de Kafka en producción a Confluent Cloud sin tiempo de inactividad. Un proceso que hasta ahora podía llevar meses pasa a resolverse en días.
Confluent Private Cloud extiende las capacidades de Confluent Cloud a infraestructura on-premise o en nube privada. En el contexto europeo actual, con DORA y NIS2 como marcos regulatorios activos y el debate sobre soberanía del dato ganando peso, es un anuncio que llega en el momento adecuado. Hoellinger es preciso sobre el perfil de cliente que lo necesita: grandes organizaciones en servicios financieros, sector público, energía y automoción que operan en entornos híbridos y necesitan que la capa de streaming conecte todos los entornos donde vive el dato, no solo la nube pública.
El adaptador dbt para Flink, ya en disponibilidad general, permite a los equipos de ingeniería de datos que trabajan con dbt extender sus pipelines de batch hacia tiempo real con cambios mínimos. Para organizaciones con equipos ya formados en dbt, elimina una de las barreras de entrada más habituales al streaming.
El consejo que no depende del tamaño de la organización
La pregunta sobre por dónde empezar produjo la respuesta más útil de la conversación con Hoellinger, y también la más directa.
«Empieza por los cimientos. Muchas organizaciones no saben todavía dónde van a construir sus experiencias agénticas en el futuro. Pero lo que sí puedes hacer hoy, sin importar el tamaño, es asegurarte de que tus datos están bien documentados: esquemas en su lugar, metadatos disponibles, trazabilidad clara de dónde viene cada dato. Eso habilita prácticamente cualquier caso de uso de IA que construyas después.»
El segundo paso que recomienda es empezar a experimentar sin esperar a tener el caso de uso perfecto identificado. Para organizaciones que ya tienen datos en Kafka, el punto de entrada más accesible es la detección de anomalías. Con las nuevas capacidades de Confluent Intelligence, es posible describir en lenguaje natural el comportamiento que se quiere detectar y obtener un Flink job funcional que se puede desplegar y mejorar de forma incremental.
La reflexión final de Hoellinger sobre la empresa agéntica resume bien el eje de todo lo que se presentó en Current 2026. Los agentes no van a vivir en un solo sistema. Vivirán en Salesforce, en SAP, en Databricks, en las herramientas que cada equipo use. El papel de Kafka en ese escenario no es ser el sistema donde se construyen los agentes. Es ser la infraestructura que distribuye el contexto a todos ellos, de forma consistente, gobernada y continua.
«El contexto lo es todo. Y conseguirlo de forma fiable para todos los agentes que una organización va a tener va a determinar quién prospera y quién no.»
Esta pieza forma parte de la cobertura de La Ecuación Digital desde Current 2026 en Londres. Próximamente: el caso de Getir y cómo la arquitectura event-driven transformó sus operaciones.
Editor en La Ecuación Digital. Analista y divulgador tecnológico con más de 30 años de experiencia en el estudio del impacto de la tecnología en la empresa y la economía.
