Estás leyendo
Commvault presenta respaldo aislado para Apache Iceberg en AWS

Commvault presenta respaldo aislado para Apache Iceberg en AWS

  • Commvault lanza una solución de ciberresiliencia para data lakehouses en AWS con soporte para Apache Iceberg, incorporando copias aisladas y restauración transaccional.
Ciberataques

Commvault ha anunciado la disponibilidad general de Clumio para Apache Iceberg en AWS, una solución que, según la compañía, constituye la primera oferta del mercado capaz de proporcionar ciberresiliencia con copias aisladas (“air-gapped”) específicamente diseñada para data lakehouses basados en Apache Iceberg en la plataforma de Amazon Web Services (AWS). La solución apunta a cubrir una carencia tecnológica identificada en la protección de entornos de análisis de datos a gran escala utilizados en aplicaciones de inteligencia artificial (IA).

La solución presentada refuerza la estrategia de Commvault de ampliar la resiliencia en toda la canalización de datos en AWS. La herramienta está pensada para atender a organizaciones que operan con arquitecturas modernas de datos, como las empleadas por compañías como Netflix, Apple o Airbnb. Según el informe de la encuesta de Dremio 2024 sobre el estado del data lakehouse, más del 70 % de los profesionales de TI y datos prevé que este tipo de arquitectura se convierta en la principal plataforma de analítica durante los próximos tres años.

Ciberresiliencia para entornos sin respaldo nativo

El auge de Apache Iceberg como formato de tabla para sistemas de almacenamiento de datos en la nube ha sido impulsado por su capacidad para gestionar grandes volúmenes de información estructurada de forma escalable. Sin embargo, su adopción ha expuesto nuevas vulnerabilidades en materia de resiliencia. Las herramientas nativas de protección de datos —como las instantáneas dentro de la misma cuenta de AWS— carecen de aislamiento y no permiten restauraciones consistentes a gran escala. Según Commvault, estos métodos tradicionales presentan limitaciones técnicas que impiden una recuperación eficaz ante fallos o ciberataques.

Clumio para Apache Iceberg busca mitigar esos riesgos mediante una solución de copia de seguridad diseñada con conocimiento específico del formato Iceberg. Este enfoque permite, entre otros elementos, la captura completa y transaccionalmente consistente del estado de las tablas, así como la automatización de los procesos de restauración.

Funciones específicas para entornos de IA y análisis de datos

La solución incorpora varias funcionalidades orientadas a entornos de datos con altas exigencias operativas:

  • Copias de seguridad conscientes de Iceberg: captura los metadatos, el historial y los datos completos de las tablas Iceberg, lo que permite una recuperación precisa sin necesidad de reconstrucción manual.
  • Aislamiento de copias en entornos seguros: las copias inmutables se almacenan fuera de la cuenta de origen, lo que dificulta su manipulación o eliminación por parte de atacantes o usuarios comprometidos.
  • Automatización del cumplimiento normativo: facilita la retención prolongada de datos según las normativas aplicables, sin impacto en el rendimiento del entorno productivo.
  • Optimización de recursos: al emplear técnicas de respaldo incremental tras la copia inicial completa, se reducen tanto los tiempos de operación como los costes asociados al almacenamiento.

Estas capacidades se aplican sobre sistemas que usan AWS Glue Data Catalog y Amazon S3 Tables, lo que amplía su alcance en entornos gestionados o autogestionados.

Evaluación del impacto en el mercado

En opinión de Archana Venkatraman, directora sénior de investigación en IDC, la aparición de esta solución responde a una necesidad emergente en el mercado: “Una protección de datos consciente de Apache, como Clumio para Apache Iceberg de Commvault, aborda directamente los riesgos emergentes de gobierno con recuperación transaccional y copias aisladas, que ya se están convirtiendo en imprescindibles”.

De acuerdo con el mismo informe de Dremio citado por Commvault, más del 70 % de los profesionales del ámbito de TI y datos prevén que la arquitectura data lakehouse se convertirá en la dominante para sus proyectos de analítica en los próximos tres años. Este dato subraya la creciente importancia de contar con soluciones de ciberresiliencia que se adapten a estos entornos distribuidos y dinámicos.

Ampliación de capacidades dentro del ecosistema AWS

El anuncio se produce tras la integración previa de Commvault con otros servicios de AWS, como Amazon S3 y DynamoDB, reforzando su presencia dentro del ecosistema de protección de datos en la nube pública. Con la incorporación de Apache Iceberg, Commvault amplía su alcance hacia una capa que se ha vuelto crítica en los flujos de trabajo relacionados con inteligencia artificial y big data.

El nuevo producto está disponible a través del AWS Marketplace y forma parte de una oferta integrada que Commvault está desarrollando con vistas al evento SHIFT 2025, que se celebrará en noviembre en Nueva York.

Te puede interesar
Palo Alto Networks

Escenarios de aplicación y gobernanza del dato

El diseño de Clumio para Apache Iceberg responde también a las crecientes exigencias regulatorias en torno al uso y almacenamiento de datos empresariales. La funcionalidad de retención ilimitada de copias, junto con la automatización de la gobernanza, facilita la gestión de datos conforme a normativas internacionales, lo cual puede resultar de especial relevancia para empresas con presencia global o sujetas a auditorías periódicas.

Por otro lado, la protección frente a ataques de ransomware adquiere un papel central. Al mantener las copias fuera del alcance de la infraestructura original, la solución ofrece una defensa adicional ante incidentes que comprometan la disponibilidad o integridad de los datos.

Disponibilidad y expectativas a futuro

Commvault ha confirmado que la solución ya está disponible de forma generalizada en AWS y puede integrarse con distintas configuraciones de almacenamiento. La empresa también ha señalado que continuará ampliando sus capacidades en otras capas del ecosistema cloud, con foco en aquellas infraestructuras asociadas al entrenamiento y despliegue de modelos de inteligencia artificial.

El anuncio se produce en un momento en que la ciberresiliencia se consolida como un componente esencial de las estrategias de continuidad operativa en sectores como el financiero, la administración pública y la industria tecnológica.

Utilizamos cookies para facilitar la relación de los visitantes con nuestro contenido y para permitir elaborar estadísticas sobre las visitantes que recibimos. No se utilizan cookies con fines publicitarios ni se almacena información de tipo personal. Puede gestionar las cookies desde aquí.   
Privacidad