Estás leyendo
Qlik Open Lakehouse integra Apache Iceberg con acceso multimotor en la nube

Qlik Open Lakehouse integra Apache Iceberg con acceso multimotor en la nube

  • Qlik lanza Open Lakehouse, plataforma basada en Apache Iceberg que permite consultas en tiempo real desde múltiples motores y despliegue en nube privada.
Qlik refuerza su integración con Databricks para potenciar la gestión de datos en tiempo real

Qlik ha anunciado la disponibilidad general de Qlik Open Lakehouse, una solución gestionada que integra tecnologías de Apache Iceberg y se despliega directamente en la cuenta en la nube del cliente, con modelo bring-your-own-compute.

Este servicio, incorporado en Qlik Talend Cloud, introduce una arquitectura orientada al uso corporativo de la inteligencia artificial (IA), con funcionalidades como optimización automática de tablas, pipelines de baja latencia mediante change data capture (CDC) y acceso simultáneo desde múltiples motores de análisis y aprendizaje automático, como Amazon Athena, Snowflake, Spark, Trino y SageMaker.

Según Qlik, durante la fase previa al lanzamiento, diversas organizaciones habrían experimentado mejoras de rendimiento de hasta cinco veces en las consultas y reducciones de costes de infraestructura cercanas al 50 %, gracias a la eliminación de redundancias y al uso de formatos abiertos.

Integración directa con Amazon S3 y soporte multimotor

Qlik Open Lakehouse almacena los datos en tablas Iceberg dentro del sistema de almacenamiento de objetos del cliente, principalmente Amazon S3, lo que permite que estas tablas sean accesibles de forma simultánea desde diferentes entornos y herramientas ya implantados en las organizaciones.

Entre ellos, destaca la compatibilidad con Amazon Athena, que permite ejecutar consultas sin necesidad de aprovisionar infraestructura, y con Amazon SageMaker, que puede trabajar directamente sobre los datos almacenados para entrenar e inferir modelos de IA sin replicaciones adicionales.

Esta aproximación elimina el acoplamiento con plataformas cerradas y permite reutilizar las herramientas analíticas existentes sin migraciones complejas. Además, la implementación se realiza en una nube privada virtual (VPC) del cliente, con control directo sobre el cómputo, lo que, según Qlik, permite una mayor gobernanza de los datos y un ajuste más preciso del rendimiento.

Automatización de mantenimiento y control de costes

La plataforma incorpora un sistema de optimización automática de Apache Iceberg, que realiza de forma continua operaciones de compactación, particionamiento y mantenimiento de metadatos, lo que impacta directamente en el rendimiento de las consultas. Esta funcionalidad opera en segundo plano, sin intervención manual, y pretende reducir tanto los tiempos de acceso a datos como los costes de almacenamiento.

Por otra parte, los pipelines construidos con tecnología CDC permiten ingestar datos desde múltiples fuentes en tiempo real, conservando un historial preciso de cambios y habilitando una analítica continua sin necesidad de cargas completas o procesos por lotes. Estas capacidades se complementan con un conjunto de herramientas integradas para gestión de calidad, catalogación y trazabilidad de los datos, incluyendo visibilidad para la gestión de costes (FinOps).

Gobernanza integrada y seguridad empresarial

Una de las características destacadas de Qlik Open Lakehouse es su enfoque en el control de acceso y la gobernanza. Las reglas de calidad de datos, el linaje y los catálogos están integrados de forma nativa, ofreciendo trazabilidad y control sobre el ciclo de vida completo de los datos. Este enfoque es especialmente relevante para sectores regulados o para modelos de IA que requieren explicabilidad y supervisión.

La integración directa con el motor de automatización de Qlik también permite que los conocimientos obtenidos a través del análisis puedan convertirse en acciones dentro de los sistemas empresariales, lo que refuerza el uso operativo de la información más allá de los paneles de visualización.

Te puede interesar
IBM IA-THLETICS

Ecosistema abierto y actualizaciones previstas

Qlik ha indicado que, además de la disponibilidad inmediata del servicio para los clientes de Talend Cloud, se prevén ampliaciones del ecosistema de integración en el último trimestre de 2025. Estas ampliaciones incluirían nuevas funciones orientadas al aprendizaje automático y mejoras en el acceso a servicios adicionales dentro de AWS y otros entornos multicloud.

Según Mike Leone, analista principal de Enterprise Strategy Group, el enfoque de Qlik Open Lakehouse responde a una necesidad creciente en las empresas: contar con una plataforma que permita manejar grandes volúmenes de datos de forma rápida, optimizarlos en tiempo real y utilizar múltiples herramientas sin replicaciones ni desarrollos adicionales. En sus palabras, el sistema “resuelve problemas comunes de datos obsoletos, lentos o costosos”, al mismo tiempo que ofrece un entorno flexible para la analítica moderna y la IA.

Preparación para la analítica avanzada

Qlik Open Lakehouse se enmarca en un movimiento más amplio hacia el uso de formatos de tabla abiertos como Apache Iceberg, que están ganando tracción por su capacidad para facilitar la interoperabilidad entre plataformas. Esta estrategia refuerza la independencia tecnológica frente a soluciones cerradas y ofrece a las empresas un mayor margen de maniobra para diseñar arquitecturas analíticas a medida.

La combinación de almacenamiento abierto, acceso multimotor, automatización y gobernanza integrada posiciona a esta solución como una infraestructura orientada a cargas de trabajo complejas, donde la inmediatez en el acceso a datos y el control sobre su ciclo de vida son condiciones clave.

Utilizamos cookies para facilitar la relación de los visitantes con nuestro contenido y para permitir elaborar estadísticas sobre las visitantes que recibimos. No se utilizan cookies con fines publicitarios ni se almacena información de tipo personal. Puede gestionar las cookies desde aquí.   
Privacidad