El gigante del almacenamiento EMC hizo una ráfaga de anuncios esta semana. Aquí están sus expectativas sobre lo que las empresas harán a continuación en el mundo del almacenamiento.
Ante la ralentización del gasto global en almacenamiento de gama alta, la fuerte presión sobre los precios de los servicios públicos de cloud computing y la demanda de almacenamiento de productos básicos baratos para clústeres a gran escala, el gigante del almacenamiento de EE.UU., EMC, está reestructurando su familia de productos VMax de primera calidad como algo más que una matriz de almacenamiento, estableciendo vínculos más estrechos con los servicios públicos de cloud computing y entrando en el negocio del almacenamiento de productos básicos.
Remodelación de la gama alta
El almacenamiento de gama alta ha sido el «fiel de la cartera de EMC durante los últimos 20 años», según Jeremy Burton, presidente de productos y marketing de EMC. La última encarnación del array insignia de EMC, su serie VMax3, intenta convertirlo en una plataforma para la consolidación de la infraestructura de los centros de datos.
Además de que VMax3 es una matriz de almacenamiento, EMC desea que las cajas ejecuten los servicios de datos que a menudo son manejados por cajas separadas. Estos servicios podrían incluir actuar como pasarelas de archivos, almacenamiento en niveles totalmente automatizado, replicación de EMC Vplex y algunas funciones ETL (Extract Transform Load.
Para apoyar estas tareas adicionales, las cajas VMax3 presentadas el martes tienen varias mejoras de hardware y software. El hardware de los nuevos dispositivos Vmax de 100K, 200K y 400K está compuesto por lo que EMC denomina motores. La familia puede escalar hasta un máximo de ocho motores para un total de 16 TB de caché, 384 núcleos y 5.760 unidades, una mezcla de discos duros y unidades SSD, que pueden proporcionar 6,3 millones de IOPS y un ancho de banda de red de 1.792 Gbps.
- 100K: Hasta dos motores de doble control. Procesador Intel Xeon E5-2620-v2 de 6 núcleos a 2,1 GHz. 24 núcleos por motor hasta un máximo de 48 núcleos. Máximo de unidades por sistema 1440 / capacidad utilizable 496TB.
- 200K: Hasta cuatro motores de doble control. Procesador Intel Xeon E5-2650 v2 de 8 núcleos a 2,6 GHz. 32 núcleos por motor hasta un máximo de 128 núcleos. Máximo de unidades por sistema 2880 / capacidad útil 2.04PB.
- 400K: Hasta ocho motores de doble control. Procesador Intel Xeon E5-2687-v2 de 12 núcleos a 2,7 GHz. 48 núcleos por motor hasta un máximo de 384 núcleos. Máximo de unidades por sistema 5760 / capacidad útil de 3.97PB.
Individualmente las especificaciones de los nuevos aparatos VMax son:
Cada motor tiene doble interconexión InfiniBand de 56 Gbps
Las cajas empaquetan los discos de forma más densa que las versiones anteriores de VMax, con las nuevas cajas de discos Viking capaces de contener 120 unidades de estado sólido de 1,6 TB en 3 unidades de rack, lo que supone un total de 64 TB de almacenamiento por unidad de rack o 640 TB por baldosa de suelo. El 100K puede tener dos gabinetes de arreglo de unidades, el 200K cuatro y el 400K ocho.
El almacenamiento de matrices VMax3 se compone de aproximadamente un 90% de discos duros y un 10% de unidades de estado sólido.
Para ayudar a estas nuevas cajas a explotar este hardware adicional, EMC ha modificado el software de VMax. La «matriz virtual dinámica» del dispositivo ayuda a garantizar que la potencia de procesamiento y la memoria disponibles se asignen de tal manera que ofrezcan un rendimiento óptimo y predecible para las cargas de trabajo. El nuevo sistema operativo Hypermax OS, un hipervisor de almacenamiento convergente y sistema operativo, permite a VMax ejecutar una gama más amplia de servicios de almacenamiento de datos EMC. El VMax 400K de gama alta puede soportar alrededor de 40.000 máquinas virtuales.
«Ahora podemos ejecutar no sólo servicios de datos, sino también aplicaciones de infraestructura, como la replicación y las consolas de backup y gestión», dijo Burton.
EMC afirma que VMAX3 ofrece un rendimiento hasta tres veces más rápido y un coste total de propiedad un 50% más bajo que los sistemas VMAX de la generación anterior, lo que acelera el procesamiento transaccional de Oracle, SQL, SAP, el análisis de datos de gran ancho de banda y las cargas de trabajo de archivos. En general, VMax3 ofrece almacenamiento a un costo de aproximadamente $3 por GB y $1.85 por IOP, de acuerdo con EMC, que también promete seis nueves disponibilidad para los dispositivos.
Otro de los principales objetivos de EMC es facilitar la gestión de su almacenamiento de gama alta, ya que Burton admite que su gama premium Symmetrix tradicionalmente no había sido considerada como «ágil».
Para facilitar la configuración, EMC ha introducido VMax Advanced FAST Suite. La suite permite a los administradores de almacenamiento establecer lo que EMC llama obligaciones de nivel de servicio (SLO) para ciertas cargas de trabajo, como la latencia máxima para acceder a los datos, y luego permite que el software decida dónde se deben colocar los datos para cumplir con esos objetivos.
En una demostración se mostró a un usuario eligiendo entre los niveles de servicio de bronce y diamante, que ofrecían una latencia de 40ms a menos de 1ms.
El servicio está diseñado para evitar que los administradores de almacenamiento tengan que dedicar tiempo a la creación manual de niveles de datos. Burton dijo que EMC quería que VMax fuera «tan fácil de gestionar como un servicio público en la nube».
Otra forma en que EMC planea reducir la carga de infraestructura y de red es a través del servicio de backup ProtectPoint de VMax. ProtectPoint introduce la capacidad de realizar copias de seguridad de datos directamente desde VMax a un sistema Data Domain, sin que los datos tengan que pasar a través de servidores de copia de seguridad intermedios o cajas que manejen servicios como la deduplicación.
Roger Cox, especialista en servidores y almacenamiento de la casa de analistas Gartner, dijo que la decisión de hacer que VMax sea más fácil de gestionar es un importante paso adelante.
«Lo más importante que han hecho con este anuncio es simplificar sustancialmente la forma de aprovisionar y gestionar estos sistemas.
Cox también dijo que ProtectPoint era una prueba más de que EMC «posicionaba a VMax como algo más que un arreglo de almacenamiento y cada vez más como una plataforma de servicios de centro de datos».
La serie VMax3 parece ser al menos comparable, si no mejor especulada, que el último modelo de Hitachi Virtual Storage Platform, el G1000, dijo.
Se espera que VMax3 y el sistema operativo Hypermax estén disponibles en el tercer trimestre de este año. Los archivos incrustados y ProtectPoint estarán disponibles en el cuarto trimestre por un costo adicional de licencia.
Trabajar con y contra la nube
EMC está tomando varias medidas para competir y beneficiarse del aumento de los servicios públicos en la nube, cuyas ofertas de almacenamiento de bajo coste amenazan con canibalizar algunos de sus negocios.
Por un lado, EMC está tomando medidas para facilitar la transferencia de datos desde su almacenamiento a los servicios públicos de cloud computing, mediante la adquisición de Twin Strata, una empresa que fabrica la tecnología de puerta de enlace de almacenamiento de cloud computing CloudArray.
CloudArray es un dispositivo de almacenamiento en caché que puede replicar automáticamente los datos almacenados en él y trasladarlos al almacenamiento en nube. El cofundador de Twin Strata, Nicos Vekiarides, dijo que la compañía planea integrar CloudArray en la plataforma de servicios de datos VMax3 «para permitir a los usuarios escalonar automáticamente las cargas de trabajo de forma aún más transparente para la expansión de la capacidad de almacenamiento fuera de las instalaciones, la protección de datos y la recuperación ante desastres». CloudArray soporta varios servicios públicos de almacenamiento en nube, incluyendo Amazon S3.
EMC también facilita el uso de herramientas de administración de terceros para aprovisionar y controlar los pools virtuales de almacenamiento que se ejecutan en sus arrays VMax. La versión 2.0 de la capa de almacenamiento definida por el software ViPR de EMC presenta lo que EMC describe como una «interfaz coherente» para administrar estos pools de almacenamiento en las capas de administración de VMware y Microsoft.
El otro enfoque de EMC para competir con los precios del almacenamiento en nube público es pasar a vender dispositivos de almacenamiento de productos básicos.
Además de administrar el almacenamiento en arreglos EMC, el controlador ViPR y la versión 3.5 de la suite de administración de recursos de almacenamiento de EMC pueden automatizar el aprovisionamiento y la administración de pools de almacenamiento basados en hardware de productos básicos no EMC.
Actualmente, EMC está construyendo dispositivos que utilizan «hardware de productos básicos» que utilizan servicios de datos ViPR para aprovisionar y gestionar pools de almacenamiento. Estos dispositivos, denominados Elastic Cloud Storage (ECS), están diseñados para ofrecer grandes pools de almacenamiento de bajo coste a un precio que compite con ofertas de almacenamiento en nube de empresas como Amazon y Google.
El director ejecutivo de EMC, David Goulden, predice que mientras que la demanda de sistemas de productos básicos como ECS crecerá enormemente, las empresas seguirán comprando dispositivos de gama alta como Vmax durante mucho tiempo.
«No estamos hablando de nada que vaya a cambiar muy rápidamente, pero la tasa de crecimiento de los sistemas de tipo ECS va a ser exponencial», dijo, y ese rápido crecimiento se debe a la captura y análisis de muchos más datos que en el pasado.
«Hay una oportunidad en euros en los sistemas tipo VMax porque de nuevo los centros de datos están creciendo entre un 25 y un 30 por ciento[cada año], así que ese es también un mercado que tiene potencial».
El primer sistema 3PB ECS será utilizado por la Biblioteca Vaticana para digitalizar sus archivos y ponerlos a disposición a través de la web.
Almacenamiento escalable
Esta semana, EMC también lanzó dos nuevos productos de almacenamiento conectados a la red de Isilon, capaces de duplicar aproximadamente el rendimiento de los modelos actuales, así como de actualizar el sistema operativo OneFS de Isilon para mejorar el rendimiento y añadir soporte para nuevos protocolos de acceso a datos. Los cambios están diseñados para ampliar las cargas de trabajo para las que Isilon es adecuado, lo que permite utilizar los clústeres de escalado para grandes análisis de datos, aplicaciones en nube y sincronización y compartición móvil.
El Isilon S210 es una actualización del S200. Está disponible con nodos de 7.2TB, 14.4TB, 21.6TB y 28.8 TB, y puede escalarse hasta 144 nodos para un cluster máximo de 4.15PB. El S210 tiene capacidad para 3,75 millones de OIA por clúster, está optimizado para altas cargas de trabajo de transacciones y puede ofrecer el doble de rendimiento que su predecesor, según EMC.
La otra novedad es el X410, una actualización de la serie X400. El X410 ofrece un aumento del 70 por ciento en el rendimiento, que se amplía a más de 200 Gbps en un clúster de 144 nodos de 5.2 PB. El producto está destinado a soportar el análisis de Hadoop, la informática de alto rendimiento y las aplicaciones de archivos empresariales.
La última versión del sistema operativo OneFS, la versión 7.1.1, soporta hasta 1PB de caché basada en flash para acelerar la recuperación de datos. OneFS 7.1.1, el S210 y el X410 estarán disponibles este mes.
EMC también planea ampliar el protocolo y los métodos de acceso para los datos almacenados en clusters de Isilon, añadiendo soporte para Hadoop Distributed File System 2.3 y OpenStack SWIFT native Object para finales de este año.
La empresa también se está asociando con Pivotal, la empresa conjunta que dirige con Vmware, para ofrecer lo que llama un Data Lake Hadoop Bundle, que se basa en Isilon NAS y está diseñado para almacenar y analizar conjuntos de datos no estructurados muy grandes.
Más de 400 organizaciones están utilizando el gran marco de procesamiento de datos Hadoop en Isilon, según Burton.