Estás leyendo
El crecimiento de IBM Storage Ceph – la base ideal para un moderno lago de datos

El crecimiento de IBM Storage Ceph – la base ideal para un moderno lago de datos

  • Por Gerald Sternagl - Gerente Gestión Técnica de Producto, IBM Storage Ceph
IBM StorageCeph 1920x720 1

Ha pasado un año desde que integró hojas de ruta de de hat rojos y equipos en IBM Storage. En ese tiempo, las organizaciones se han enfrentado a desafíos de sin precedentes para escalar la IA debido al rápido crecimiento de los datos en más lugares y formatos, pero con peor calidad. Ayudar a los clientes a combatir este problema ha significado modernizar su infraestructura con soluciones de vanguardia como parte de sus transformaciones . En gran medida, esto implica la entrega de aplicaciones y almacenamiento de datos consistentes en entornos locales y en la nube. Además, crucialmente, esto incluye ayudar a los clientes a adoptar arquitecturas nativas de la nube para realizar los beneficios de la nube pública como el costo, la velocidad y la elasticidad. Anteriormente, Red Hat Ceph, ahora  IBM Storage Ceph, una plataforma de almacenamiento de software de código abierto de última generación, es una piedra angular en este esfuerzo. 

El almacenamiento definido por software (SDS) ha surgido como una fuerza transformadora cuando se trata de la gestión de datos, ofreciendo una serie de ventajas sobre las matrices de almacenamiento tradicionales heredadas, incluyendo una flexibilidad extrema y escalabilidad que son adecuados para manejar casos de usos modernos como IA generativa. Con IBM Storage Ceph, los recursos de almacenamiento se extraen del hardware subyacente, lo que permite la asignación dinámica y la utilización eficiente del almacenamiento de datos. Esta flexibilidad no sólo simplifica la gestión sino que también mejora la agilidad en la adaptación a la evolución de las necesidades de las empresas y la reducción de los cómputo y la capacidad a medida que se introducen nuevas cargas de trabajo. Esta plataforma de auto-curación y autogestión está diseñada para ofrecer servicios de almacenamiento de archivos, bloques y objetos unificados a escala en hardware estándar de la industria. El almacenamiento unificado ayuda a proporcionar a los clientes un puente desde aplicaciones heredadas que se ejecutan en archivos independientes o almacenamiento de bloques a una plataforma común que incluye esos y el almacenamiento de objetos en un solo aparato.

Ceph está optimizado para grandes despliegues individuales y multisitio y puede escalar eficientemente para apoyar cientos de petabytes de datos y decenas de miles de millones de objetos, que es clave para cargas de carga de IA tradicionales y nuevas generadoras. La escalabilidad, resiliencia y seguridad de IBM Storage Ceph hacen ideal para apoyar la casa de datos y marcos de código abierto AI/ML, además de cargas de trabajo más tradicionales como MySQL y MongoDB en Red Hat OpenShift o RedHat OpenStack. Es una de las razones por las que 768 TiB capacidad bruta de IBM Storage Ceph se incluye en watsonx.data, IBMs open, gobernado, fit-for-purpose lahouse architecture de lacushouse optimizado para cargas de trabajo de datos, análisis e IA.

La Fundación de Equifit para las cargas de trabajo intensivas e datos-intensas

El crecimiento explosivo de los datos no estructurados y la IA generativa comparten una relación simbiótica, cada una influyente y beneficiando al otro. En su informe Top Trends in Enterprise Data Storage 2023, Gartner afirma que para 2028, las grandes empresas triplicarán su capacidad de datos no estructuradas en sus instalaciones, bordes y lugares de la nube pública, en comparación con mediados de 2020. La proliferación de datos no estructurados, como texto, imágenes y videos, proporciona una amplia y diversa fuente para la formación de modelos de IA generadoras. A su vez, la IA generadora ayuda a dar sentido y extraer información valiosa del grupo de datos no estructurados en constante expansión. Esta sinergia resulta en un bucle de retroalimentación donde la IA generadora prospera en la abundancia de datos no estructurados, y la generación continua de datos realistas por IA enriquece y refina su comprensión de conjuntos de datos no estructurados, fomentando la innovación y los avances.

En 2028, el 70% de los datos de archivos y objetos se desplegarán en una plataforma consolidada de almacenamiento de datos no estructurada, frente al 35% a principios de 2023, según el mismo informe de Gartner. Por lo tanto, las organizaciones necesitan una solución de gestión del almacenamiento capaz de una ingester de datos acelerada, de limpieza y clasificación de datos, gestión y aumento de metadatos y gestión y despliegue de la capacidad en la nube, como el almacenamiento definido por software. IBM Storage Ceph se expande sin problemas para satisfacer estas crecientes demandas de datos. Sus capacidades de autogestión aseguran que el sistema se adapte continuamente a condiciones en constante cambio, haciendo que la solución sea libre de problemas manteniendo fácilmente la integridad de los datos.

Para acelerar y escalar el impacto de los datos y la IA en una organización y, en última instancia, mejorar los resultados empresariales, las empresas deben ser híbridas por diseño. Esto incluye la capacidad de consumir servicios de almacenamiento en preparación con un modelo operativo nublado para abordar cuestiones como la necesidad de conjuntos de características empresariales no disponibles en la nube pública, consideraciones de soberanía de datos y costo. La arquitectura de plug-and-play de IBM Storage Ceph simplifica la integración con las infraestructuras existentes, incluyendo varias plataformas, entornos en la nube, hipervisores, repositorios de código abierto como Apache Iceberg o Apache Parquet, y pilas de solución completa como watsonx.ai, watsonx.data, y otras. Nuevos nodos o dispositivos se pueden agregar al cúmulo sin problemas, sin tener interrupciones o tiempo de intemperio de servicio. ​Protega una manera fácil y eficiente para que los clientes construya una casa lacudera de datos con watsonx.data y otras cargas de trabajo de IA de próxima generación.

Acceso rápido de datos con NVMe a la vez TCP

En el último año, IBM ha introducido varias actualizaciones importantes a Ceph, incluyendo, la más reciente, IBM Storage Ceph 7.0. Esta plataforma Ceph de próxima generación se prepara para las capacidades NVMe/TCP que están diseñadas para permitir una transferencia de datos más rápida entre dispositivos de almacenamiento, servidores y plataformas en la nube mediante la retención de las características de baja latencia y alto ancho de banda de NVMe tradicional. Esto lo hace adecuado para aplicaciones que demandan acceso de almacenamiento ultrarrápido, como bases de datos, análisis y entrega de contenidos, y simplifica la infraestructura debido a su compatibilidad con las inversiones tradicionales en tecnología de red. Estos beneficios ayudarán a los clientes a adoptar un enfoque definido por software diseñado para ofrecer una experiencia similar a la nube en términos de velocidad, agilidad y economía.

NVMe/TCP puede ayudar a Ceph a cerrar la brecha para el almacenamiento tradicional de bloques con arquitecturas de escala. Con NVMe/TCP, Ceph se diseñará para integrarse con plataformas como VMware para ayudar a las empresas a replicar arquitecturas en la nube en su propio centro de datos, alejándose de redes costosas y rígidas de SAN y matrices de almacenamiento monolíticos.

Otras nuevas características incluidas en Ceph 7.0:

SEC y FINRA certificación de la compliancia para WORM con bloqueo de objetos, permitiendo el cumplimiento de WORM para el almacenamiento de objetos
Soporte NFS para el acceso a sistema de archivos CephFS para clientes no nativos de Ceph
Para más detalles sobre las características, visite la comunidad de IBM Storage aquí
Economías en la nube de escala con Ceph de almacenamiento de IBM

Te puede interesar
Miguel Sánchez Galindo - DigitalES - La Ecuación Digital

Debido a que IBM Storage Ceph almacena datos como objetos dentro de conjuntos de almacenamiento lógico, un solo clúster puede tener múltiples piscinas, cada una sintonizada con diferentes requisitos de rendimiento o capacidad. Esto permite a los clientes beneficiarse de un acceso más fácil y rápido a los datos con clasificaciones de contenido y contexto, capacidad de almacenamiento limitada sólo por el tamaño de una infraestructura de organización, y reducciones de costos a escala mediante la eliminación de restricciones de hardware en comparación con las arquitecturas de matriz de almacenamiento tradicionales y heredadas.

Tiempo más rápido para valorar

IBM también ha hecho más fácil el despliegue para Ceph que nunca. Con nodos Ready Storage de IBM

para Ceph, la plataforma se puede desplegar como una solución completa de software y hardware y viene en una variedad de configuraciones de capacidad diferentes optimizadas para ejecutar las cargas de trabajo de IBM Storage Ceph. Hemos tomado todas las conjeturas fuera de la configuración, haciendo que sea más fácil de digerir, configurar y administrar.

El crecimiento de IBM Storage Ceph es sólo otro ejemplo de cómo la cartera de hardware y software de almacenamiento de IBMs ayuda a proporcionar un tiempo más rápido para valorar con capacidad y rendimiento escalados para optimizar los costos para los clientes.

Utilizamos cookies para facilitar la relación de los visitantes con nuestro contenido y para permitir elaborar estadísticas sobre las visitantes que recibimos. No se utilizan cookies con fines publicitarios ni se almacena información de tipo personal. Puede gestionar las cookies desde aquí.   
Privacidad