Estás leyendo
Nutanix Agent Gateway controla costes de IA agéntica

Nutanix Agent Gateway controla costes de IA agéntica

  • Nutanix Agent Gateway llega a Enterprise AI 2.7 para unificar accesos, auditoría y consumo de tokens en despliegues empresariales de IA agéntica híbrida.
Nutanix .Next2026

Nutanix Agent Gateway llega a Nutanix Enterprise AI 2.7 con una función concreta: colocar un punto de control entre los agentes de IA, los grandes modelos de lenguaje y las herramientas empresariales que empiezan a quedar conectadas a esos flujos. La compañía, cotizada en Nasdaq bajo el ticker NTNX y especializada en computación híbrida multicloud, sitúa esta pieza en un momento delicado para muchas organizaciones. Los pilotos de IA generativa ya no explican toda la conversación. El debate se desplaza hacia despliegues en producción, agentes autónomos, permisos persistentes, costes por token y trazabilidad.

La diferencia operativa es relevante. Un chatbot corporativo puede tener un perímetro relativamente acotado. Un agente, en cambio, ejecuta tareas, consulta modelos, accede a aplicaciones, llama a herramientas y puede encadenar acciones con otros agentes o subprocesos. En ese recorrido aparecen puntos de fricción para TI: quién autoriza cada acceso, cómo se mide el consumo, qué proveedor de modelo interviene, qué datos entran en cada interacción y qué ocurre cuando el gasto crece sin una asignación clara.

Nutanix plantea Agent Gateway como una capa centralizada para ordenar ese tráfico. La solución supervisa la actividad, aplica políticas de acceso y monitoriza el consumo de tokens tanto en modelos de última generación alojados en nube pública como en modelos privados autohospedados. Para desarrollo, la promesa es trabajar con una API unificada. Para TI, el valor reside en concentrar gobierno, observabilidad y control económico en un único plano.

Nutanix Agent Gateway y la presión del coste por token

El consumo de tokens se ha convertido en una métrica de negocio antes de que muchas empresas hayan terminado de definir sus modelos internos de imputación. Cada llamada a un LLM tiene un coste, aunque el impacto real dependa del proveedor, el tipo de modelo, el volumen de contexto, la latencia requerida y la frecuencia con la que los agentes ejecutan tareas. En arquitecturas agénticas, ese patrón puede acelerarse. Un proceso aparentemente sencillo puede generar varias llamadas intermedias, consultar herramientas externas y producir gasto adicional sin que el usuario final perciba esa complejidad.

Agent Gateway centraliza la observabilidad sobre ese consumo entre distintos proveedores de modelos. La plataforma permite supervisar el uso por agente y por equipo, aplicar cuotas y limitar de forma granular el gasto basado en tokens. Esta capacidad introduce una lectura financiera de la IA que va más allá del presupuesto agregado de nube: los responsables de TI pueden identificar qué cargas consumen más, qué unidades de negocio generan mayor demanda y qué casos podrían trasladarse a modelos autohospedados para reducir dependencia de servicios externos.

La cuestión no queda en ahorrar. En entornos empresariales, el coste también funciona como señal de diseño. Un agente que multiplica llamadas puede estar mal configurado, usar un modelo sobredimensionado o carecer de límites para determinadas tareas. La visibilidad en tiempo real permite ajustar rutas de inferencia, comparar proveedores y decidir cuándo conviene usar un modelo privado, aunque ese cambio exija capacidad de infraestructura, mantenimiento y criterios de calidad propios.

MCP, permisos y trazabilidad en el acceso a herramientas

Uno de los elementos centrales de la propuesta es la gobernanza de MCP, el Model Context Protocol, que está ganando terreno como vía para conectar agentes con herramientas, aplicaciones y fuentes de datos privadas mediante interfaces estandarizadas. La estandarización reduce la necesidad de integraciones a medida, aunque también concentra riesgos si no existe un control claro de qué agente puede acceder a qué servidor, bajo qué condiciones y con qué finalidad operativa.

Nutanix Agent Gateway incorpora controles de acceso granulares a servidores MCP y filtrado de herramientas a nivel de agente. En la práctica, esto permite acotar las capacidades de cada flujo: un agente de soporte puede consultar una base documental, otro orientado a finanzas puede acceder a determinados sistemas internos y un tercero puede quedar restringido a modelos o herramientas concretas. El detalle importa porque los agentes no operan como usuarios tradicionales. Actúan en nombre de procesos, departamentos o aplicaciones, y esa delegación obliga a revisar el modelo de identidad y permisos.

La solución incluye registros de auditoría para las solicitudes realizadas a servidores MCP. Esa trazabilidad resulta especialmente sensible en sectores regulados, donde no basta con saber que una decisión o una recomendación se produjo con asistencia de IA. También puede ser necesario reconstruir qué datos fueron consultados, qué herramienta se invocó, qué modelo procesó la petición y qué agente inició la acción. La auditoría reduce la zona ciega que aparece cuando los equipos despliegan agentes de forma distribuida y con credenciales dispersas.

El gobierno de la IA se acerca a la infraestructura

Nutanix enmarca Agent Gateway dentro de una visión de IA empresarial híbrida. La compañía combina el acceso a modelos externos con la posibilidad de operar modelos privados autohospedados, un enfoque alineado con empresas que quieren mantener mayor control sobre datos, costes y soberanía operativa. La tensión es conocida en los comités de tecnología: los modelos en nube pública ofrecen velocidad de adopción, variedad y escalabilidad; los modelos privados dan más control, pero trasladan al cliente parte de la responsabilidad de operación, rendimiento y actualización.

Te puede interesar
Johnson Controls lanza Metasys 16.0 para edificios críticos

La API unificada incluida en Agent Gateway intenta rebajar esa complejidad para los desarrolladores. En lugar de integrar cada aplicación con distintos proveedores o endpoints, los equipos pueden acceder a modelos externos y autohospedados desde una misma capa. Esa abstracción facilita cambios de proveedor, pruebas comparativas y decisiones de enrutamiento según coste, disponibilidad o adecuación del modelo al caso de uso. Sin embargo, una capa común también exige disciplina de plataforma: catálogo de modelos, políticas de uso, supervisión de versiones y criterios para decidir qué tareas merecen modelos más avanzados.

Sammy Zoghlami, vicepresidente sénior de EMEA en Nutanix, resume el problema desde la escala. «Las organizaciones están evolucionando rápidamente de proyectos piloto a despliegues de IA agéntica a gran escala, lo que implica tener cientos o incluso miles de agentes autónomos», afirma. A su juicio, «sin una gobernanza centralizada resultará cada vez más difícil controlar los costes, los accesos y el cumplimiento normativo». La frase apunta a una preocupación recurrente entre CIO y responsables de plataforma: la IA agéntica puede extenderse más rápido que las estructuras internas preparadas para gobernarla.

El lanzamiento encaja con una etapa en la que la infraestructura de IA deja de medirse solo por GPUs, almacenamiento o proximidad del dato. La capa de control empieza a ganar peso porque los agentes necesitan rutas fiables hacia modelos, herramientas y sistemas corporativos. También porque el riesgo operativo se distribuye. Un fallo de permisos, una llamada excesiva a modelos caros o una herramienta mal expuesta pueden afectar a varios procesos a la vez.

Para las empresas españolas que exploran automatización avanzada, la decisión no se reduce a adoptar una nueva pieza de software. Implica revisar cómo se separan las responsabilidades entre desarrollo, seguridad, operaciones y finanzas. Agent Gateway ofrece un mecanismo para centralizar esa conversación, aunque su eficacia dependerá de políticas claras, métricas compartidas y una gestión activa del ciclo de vida de los agentes. La IA agéntica introduce velocidad en procesos que antes tenían más intervención humana; el control de esa velocidad empieza a convertirse en una tarea de arquitectura empresarial.

Ver Comentarios (0)

Leave a Reply

Utilizamos cookies para facilitar la relación de los visitantes con nuestro contenido y para permitir elaborar estadísticas sobre las visitantes que recibimos. No se utilizan cookies con fines publicitarios ni se almacena información de tipo personal. Puede gestionar las cookies desde aquí.   
Privacidad