Qlik ha anunciado la disponibilidad general de Qlik Open Lakehouse, una solución gestionada que integra tecnologías de Apache Iceberg y se despliega directamente en la cuenta en la nube del cliente, con modelo bring-your-own-compute.
Este servicio, incorporado en Qlik Talend Cloud, introduce una arquitectura orientada al uso corporativo de la inteligencia artificial (IA), con funcionalidades como optimización automática de tablas, pipelines de baja latencia mediante change data capture (CDC) y acceso simultáneo desde múltiples motores de análisis y aprendizaje automático, como Amazon Athena, Snowflake, Spark, Trino y SageMaker.
Según Qlik, durante la fase previa al lanzamiento, diversas organizaciones habrían experimentado mejoras de rendimiento de hasta cinco veces en las consultas y reducciones de costes de infraestructura cercanas al 50 %, gracias a la eliminación de redundancias y al uso de formatos abiertos.
Integración directa con Amazon S3 y soporte multimotor
Qlik Open Lakehouse almacena los datos en tablas Iceberg dentro del sistema de almacenamiento de objetos del cliente, principalmente Amazon S3, lo que permite que estas tablas sean accesibles de forma simultánea desde diferentes entornos y herramientas ya implantados en las organizaciones.
Entre ellos, destaca la compatibilidad con Amazon Athena, que permite ejecutar consultas sin necesidad de aprovisionar infraestructura, y con Amazon SageMaker, que puede trabajar directamente sobre los datos almacenados para entrenar e inferir modelos de IA sin replicaciones adicionales.
Esta aproximación elimina el acoplamiento con plataformas cerradas y permite reutilizar las herramientas analíticas existentes sin migraciones complejas. Además, la implementación se realiza en una nube privada virtual (VPC) del cliente, con control directo sobre el cómputo, lo que, según Qlik, permite una mayor gobernanza de los datos y un ajuste más preciso del rendimiento.
Automatización de mantenimiento y control de costes
La plataforma incorpora un sistema de optimización automática de Apache Iceberg, que realiza de forma continua operaciones de compactación, particionamiento y mantenimiento de metadatos, lo que impacta directamente en el rendimiento de las consultas. Esta funcionalidad opera en segundo plano, sin intervención manual, y pretende reducir tanto los tiempos de acceso a datos como los costes de almacenamiento.
Por otra parte, los pipelines construidos con tecnología CDC permiten ingestar datos desde múltiples fuentes en tiempo real, conservando un historial preciso de cambios y habilitando una analítica continua sin necesidad de cargas completas o procesos por lotes. Estas capacidades se complementan con un conjunto de herramientas integradas para gestión de calidad, catalogación y trazabilidad de los datos, incluyendo visibilidad para la gestión de costes (FinOps).
Gobernanza integrada y seguridad empresarial
Una de las características destacadas de Qlik Open Lakehouse es su enfoque en el control de acceso y la gobernanza. Las reglas de calidad de datos, el linaje y los catálogos están integrados de forma nativa, ofreciendo trazabilidad y control sobre el ciclo de vida completo de los datos. Este enfoque es especialmente relevante para sectores regulados o para modelos de IA que requieren explicabilidad y supervisión.
La integración directa con el motor de automatización de Qlik también permite que los conocimientos obtenidos a través del análisis puedan convertirse en acciones dentro de los sistemas empresariales, lo que refuerza el uso operativo de la información más allá de los paneles de visualización.
Ecosistema abierto y actualizaciones previstas
Qlik ha indicado que, además de la disponibilidad inmediata del servicio para los clientes de Talend Cloud, se prevén ampliaciones del ecosistema de integración en el último trimestre de 2025. Estas ampliaciones incluirían nuevas funciones orientadas al aprendizaje automático y mejoras en el acceso a servicios adicionales dentro de AWS y otros entornos multicloud.
Según Mike Leone, analista principal de Enterprise Strategy Group, el enfoque de Qlik Open Lakehouse responde a una necesidad creciente en las empresas: contar con una plataforma que permita manejar grandes volúmenes de datos de forma rápida, optimizarlos en tiempo real y utilizar múltiples herramientas sin replicaciones ni desarrollos adicionales. En sus palabras, el sistema “resuelve problemas comunes de datos obsoletos, lentos o costosos”, al mismo tiempo que ofrece un entorno flexible para la analítica moderna y la IA.
Preparación para la analítica avanzada
Qlik Open Lakehouse se enmarca en un movimiento más amplio hacia el uso de formatos de tabla abiertos como Apache Iceberg, que están ganando tracción por su capacidad para facilitar la interoperabilidad entre plataformas. Esta estrategia refuerza la independencia tecnológica frente a soluciones cerradas y ofrece a las empresas un mayor margen de maniobra para diseñar arquitecturas analíticas a medida.
La combinación de almacenamiento abierto, acceso multimotor, automatización y gobernanza integrada posiciona a esta solución como una infraestructura orientada a cargas de trabajo complejas, donde la inmediatez en el acceso a datos y el control sobre su ciclo de vida son condiciones clave.
