F5 integra DPU BlueField-3 y DOCA para optimizar Kubernetes en IA

F5 incorpora BlueField-3 y DOCA a BIG-IP Next for Kubernetes, mejorando la gestión del tráfico y la eficiencia de GPU para aplicaciones empresariales de IA.

F5 ha anunciado la expansión de su solución BIG-IP Next for Kubernetes , que ahora incorpora aceleración mediante las unidades de procesamiento de datos NVIDIA BlueField-3 y el marco de software NVIDIA DOCA. Esta combinación tecnológica ha sido validada por Sesterce, operador europeo especializado en infraestructuras de inteligencia artificial y computación de alto rendimiento, como parte de una propuesta enfocada a responder a las crecientes demandas de eficiencia y rendimiento en entornos empresariales centrados en IA.

La colaboración técnica entre F5 y NVIDIA se enmarca en una estrategia orientada a facilitar el despliegue de aplicaciones diseñadas desde su origen para aprovechar modelos de lenguaje a gran escala (LLM).

Según ha comunicado F5, las nuevas capacidades introducidas en BIG-IP Next buscan optimizar el uso de GPU, reducir la latencia en flujos de inferencia y ampliar la seguridad para sistemas MCP, mediante un ecosistema programable y escalable.

Optimización del tráfico LLM y rendimiento multi-tenant

Uno de los principales focos de la solución es la gestión avanzada del tráfico LLM. La integración permite que las tareas de IA se redirijan hacia modelos ligeros o especializados, en función del tipo de consulta. Esta lógica de enrutamiento se implementa directamente sobre las DPU BlueField-3, lo que permite reducir la latencia y aumentar la velocidad de respuesta desde el primer token generado.

Durante las pruebas llevadas a cabo por Sesterce, la solución mostró una mejora del 20 % en el uso de GPU, además de una integración directa con herramientas como NVIDIA Dynamo y KV Cache Manager. Estas funcionalidades permiten reducir los cuellos de botella en sistemas distribuidos, aprovechando almacenamiento en caché basado en claves para optimizar procesos repetitivos en inferencia.

“Este enfoque nos permite distribuir el tráfico de forma más eficiente y optimizar el uso de nuestras GPU, a la vez que aportamos un valor añadido y único a nuestros clientes”, declaró Youssef El Manssouri, CEO de Sesterce. La compañía ha destacado también la capacidad multi-tenant y las opciones de personalización mediante iRules como elementos clave para adaptarse a cargas de trabajo dinámicas.

Control de tráfico IA en Kubernetes con iRules y MCP

F5 ha incorporado soporte específico para el Protocolo de Contexto de Modelo (MCP), permitiendo una integración como proxy inverso para servidores MCP. Esta función refuerza la seguridad de las comunicaciones con LLM y ofrece protección frente a nuevas amenazas asociadas a entornos de IA autónoma.

Las funciones de programabilidad avanzadas de iRules permiten a los operadores adaptar rápidamente la configuración a los cambios en los protocolos de IA, sin necesidad de intervenir en la arquitectura central de las aplicaciones. Según World Wide Technology, esta funcionalidad aporta una ventaja operativa al consolidar la gestión del tráfico y la seguridad en un único entorno orquestado sobre Kubernetes.

Te puede interesar

HPE integra las capacidades de Juniper para escalar la IA en el sector telco

Eficiencia distribuida con NVIDIA Dynamo y BlueField-3

La solución incorpora la integración con NVIDIA Dynamo, una plataforma orientada a la inferencia de IA a gran escala. Dynamo permite el uso de mecanismos como el Key-Value Cache Manager para almacenar información de consultas previas y reducir la redundancia en la ejecución de modelos. En combinación con la descarga de operaciones hacia las DPUs BlueField, se logra liberar carga de las CPU y reducir los costes asociados al almacenamiento en memoria GPU.

“Con BIG-IP Next sobre BlueField-3, las empresas disponen de un único punto de control para el tráfico destinado a factorías de IA”, señaló Ash Bhalgat, directivo de NVIDIA. Además, añadió que la arquitectura soporta funciones adicionales para entrenamiento, recuperación aumentada por generación (RAG) e IA autónoma.

Aplicaciones empresariales y continuidad de la colaboración

El producto ya está disponible para su implementación. La solución conjunta ofrece un punto de entrada para organizaciones que necesitan escalar entornos de IA complejos, incluyendo modelos de lenguaje multitarea y sistemas de razonamiento autónomo. F5 y NVIDIA han adelantado que prevén seguir ampliando las capacidades de la plataforma con nuevas funciones de seguridad, orquestación de recursos y compatibilidad con herramientas específicas del ecosistema de IA generativa.

La validación de Sesterce, junto con las aportaciones técnicas de ambas compañías, refuerzan el posicionamiento de la solución en escenarios empresariales europeos que requieren control sobre el rendimiento, la soberanía tecnológica y la gestión eficiente de recursos de computación en entornos Kubernetes.

Etiquetas

F5 kubernetes nvidia sesterce

F5 integra DPU BlueField-3 y DOCA para optimizar Kubernetes en IA

Equinix lanza un Hub para IA Distribuida enfocado en la infraestructura empresarial

El MWC 2026 revela el papel crítico de la interconexión

Samsung expande la conexión por satélite en los Galaxy S26

Telefónica digitaliza la logística de Grupo Gallo con una plataforma habilitada para IA

Sopra Steria impulsa la digitalización en Baleares con VÈRTEX

Europa ante la carrera tecnológica global: cortar, simplificar e incentivar como estrategia digital

Reino Unido se prepara para su mayor inversión en infraestructura de IA

La inteligencia artificial redefine las redes sociales y plantea dilemas éticos en la comunicación digital

La soberanía tecnológica reconfigura el mapa de las startups europeas más prometedoras

Microsoft abre Copilot a modelos externos y establece un plano de control para la IA autónoma

SAP segmenta su soporte para acelerar la adopción de IA

SAP y Sopra Steria impulsan la soberanía digital europea

HM Hospitales y Huawei crean un centro de innovación clínica

El giro hacia la interoperabilidad en la infraestructura móvil

Microsoft abre Copilot a modelos externos y establece un plano de control para la IA autónoma

SAP segmenta su soporte para acelerar la adopción de IA

El Ayuntamiento de Madrid articula su gestión pública mediante la plataforma PLADA

La soberanía tecnológica reconfigura el mapa de las startups europeas más prometedoras

Cinco nuevos unicornios reconfiguran el mapa tecnológico europeo

Más del 50% de las startups españolas usa IA según el Mapa del Emprendimiento 2025

Infosecurity Europe 2026 analiza la ciberseguridad transfronteriza

Cisco reúne a los líderes de NVIDIA, OpenAI y AWS para analizar la gobernanza global de la inteligencia artificial

Deloitte presenta su visión sobre la IA en CES 2026

IA y turismo: cómo la tecnología fintech ayuda a gestionar gastos en los viajes

La revolución LendTech en el sector financiero: retos y oportunidades

Unicaja entra en el consejo de administración de Bit2Me y se convierte en el banco de referencia de la fintech española

Fundación Telefónica invierte 12 millones en talento tecnológico

La revalorización de la técnica frente a la urgencia soberana de Europa

Huawei Spain Academy forma a 10.000 personas en 2025

El reto del crecimiento orgánico en la consultoría tecnológica tras el auge de la IA

NVIDIA consolida su dominio con ingresos récord de 215.000 millones

OpenAI capta 110.000 millones y altera el equilibrio de la IA