Editor en La Ecuación Digital. Analista y divulgador tecnológico con…
La arquitectura de la inteligencia artificial corporativa está desplazando su centro de gravedad desde la generación de lenguaje hacia la capacidad de predecir resultados sobre el dato estructurado. En un movimiento estratégico doble que busca cerrar la brecha entre el almacenamiento masivo y la ejecución autónoma, SAP SE ha anunciado hoy el acuerdo para adquirir Dremio y Prior Labs. Ambas operaciones, pendientes de validación regulatoria y previstas para completarse durante el tercer trimestre de 2026, dibujan una hoja de ruta donde la IA de propósito general se considera insuficiente para las complejidades de un balance financiero o una cadena de suministro.
El problema que SAP intenta resolver es una fricción estructural en el sector tecnológico: la fragmentación del dato. La mayoría de los proyectos de IA a gran escala encallan porque la información subyacente reside en formatos propietarios, desprovista del contexto empresarial que le da sentido. Según explica Philipp Herzig, Chief Technology Officer de SAP SE, la IA empresarial no se estanca por deficiencias en los modelos, sino porque los datos no están preparados para la interacción con agentes. El resultado suele ser un patrón de costes elevados y pilotos que mueren antes de escalar por la imposibilidad de explicar cómo se llegó a una decisión automatizada.
Al integrar Dremio, SAP busca transformar su Business Data Cloud en un «lakehouse» empresarial nativo basado en Apache Iceberg. Este formato de tabla abierta se establece como la piedra angular del sistema, eliminando la necesidad de mover o convertir datos entre silos. En la práctica, esto supone que los datos de SAP y los de otros proveedores pueden coexistir en una base abierta, permitiendo un alcance analítico federado. El motor en memoria de SAP HANA Cloud se encargará de las transacciones en tiempo real, mientras que la plataforma elástica de Dremio escalará automáticamente para absorber picos de demanda sin necesidad de aprovisionar capacidad fija.
Sin embargo, el acceso al dato es solo una parte de la ecuación. La adquisición de Prior Labs, pionera en modelos fundacionales tabulares (TFM), aborda la limitación cognitiva de los grandes modelos de lenguaje (LLM). Mientras que estos últimos presentan dificultades para realizar predicciones precisas sobre cifras y estadísticas al tener una comprensión rudimentaria de las tablas, los TFM están diseñados específicamente para el razonamiento estadístico. Estos modelos pueden inferir con exactitud riesgos de proveedores, oportunidades de ventas adicionales o posibles pérdidas de clientes basándose directamente en el análisis de las estructuras de datos que hacen funcionar a las empresas.
SAP ha comprometido una inversión superior a los 1.000 millones de euros en los próximos cuatro años para consolidar a Prior Labs como un laboratorio de IA avanzada en Europa. Frank Hutter, director ejecutivo de Prior Labs, subraya que la unión con SAP aporta los recursos y el alcance de clientes necesarios para llevar esta tecnología a su máximo potencial. Para garantizar la velocidad de la investigación, el laboratorio operará como una entidad independiente, aunque sus avances tendrán una vía directa de comercialización a través de SAP AI Core y la capa de agentes de Joule.
La propuesta técnica de Prior Labs destaca por su modelo TabPFN-2.6, que actualmente lidera las pruebas de rendimiento en TabArena. Este modelo permite lo que se denomina aprendizaje en contexto: los usuarios pueden proporcionar registros de datos y recibir predicciones instantáneas sin necesidad de entrenar un modelo específico para cada caso. Esta capacidad reduce drásticamente la complejidad técnica y facilita el cumplimiento del RGPD, ya que el razonamiento estadístico ocurre sobre la marcha y se adapta dinámicamente a cualquier escenario hipotético planteado por un directivo a través de una interfaz conversacional.
La integración de ambas compañías también redefine la capa semántica de SAP. Mediante un catálogo universal basado en Apache Polaris y la API abierta Apache Iceberg REST Catalog, SAP ofrecerá un único punto de acceso al contexto empresarial unificado. Este catálogo no solo gestiona derechos de acceso, sino que establece el linaje del dato y sus relaciones jerárquicas, sirviendo de base para el SAP Knowledge Graph. En este grafo, las clasificaciones normativas y las estructuras organizativas se incorporan como propiedades nativas, permitiendo que cualquier motor conectado, sea propio o de un tercero, entienda el significado real de la información que procesa.
El compromiso con el código abierto es un eje transversal en esta doble operación. SAP mantendrá la inversión en los proyectos Apache Arrow, Iceberg y Polaris, además de seguir apoyando la estrategia de código abierto de TabPFN, que ya cuenta con más de tres millones de descargas. Este enfoque busca evitar el «vendor lock-in» o secuestro tecnológico, permitiendo que las organizaciones mantengan su soberanía de datos mientras aprovechan la potencia de los nuevos modelos tabulares.
A pesar de la robustez del anuncio, la ejecución plantea desafíos operativos de calado. Unificar la lógica de negocio de sistemas transaccionales críticos con la flexibilidad de un entorno lakehouse requiere una orquestación que va más allá del software. La verdadera transformación reside en pasar de la correlación de datos a la comprensión de la causalidad. Responder a por qué va a ocurrir un retraso en la cadena de suministro es sensiblemente más complejo que simplemente predecir su probabilidad. Al combinar la infraestructura de Dremio con la capacidad analítica de Prior Labs, SAP no solo aspira a ser el repositorio del dato empresarial, sino el sistema nervioso que razone sobre él de forma autónoma y transparente.
La operación cuenta con el respaldo de figuras de peso en la comunidad científica. El consejo asesor de Prior Labs incluirá a Yann LeCun, ganador del Premio Turing, y a Bernhard Schoelkopf, director del Instituto Max Planck de Sistemas Inteligentes. Esta presencia sugiere que SAP no busca solo una integración de producto, sino liderar la definición de una nueva categoría de inteligencia artificial que, a diferencia de los modelos de chat, se sienta cómoda operando entre filas, columnas y variables macroeconómicas.
Editor en La Ecuación Digital. Analista y divulgador tecnológico con más de 30 años de experiencia en el estudio del impacto de la tecnología en la empresa y la economía.
