Hablando sobre las Cabinas de Discos (SAN)

Hoy os quiero hablar un poco sobre las cabinas de discos que tanto se utilzan en los sistemas informáticos profesionales, también conocidas como Storage Area Network (SAN), cuya traducción equivaldría a Área de Almacenamiento en Red. Estas cabinas son muy robustas y son el pilar de los entornos de alta disponibilidad.

Si tienes alguna duda sobre lo que es un sistema de alta disponibilidad, puedes echarle un vistazo a los siguientes artículos:

¿Qué es y para qué se utiliza una cabina de discos SAN?

Empezamos por el principio. Una cabina de discos SAN es un dispositivo de almacenamiento externo que se utiliza para almacenar y administrar grandes cantidades de datos en una red de almacenamiento. Se compone de una serie de discos duros configurados en matrices redundantes y conectados a través de una red de alta velocidad, como Fiber Channel o iSCSI, que permite a múltiples servidores acceder y compartir los datos de manera eficiente y rápida.

Cabina de discos (SAN) HPE 3PAR 7200

La principal función de una cabina de discos SAN es proporcionar almacenamiento centralizado y compartido para servidores en una red. Esto facilita la administración y el acceso a los datos de manera simultánea por parte de múltiples usuarios o sistemas, lo que resulta útil en entornos empresariales con altas demandas de almacenamiento y rendimiento. Algunos de los usos comunes de una cabina de discos SAN incluyen:

  1. Almacenamiento de datos críticos: Proporciona un lugar seguro y confiable para almacenar datos empresariales críticos, como bases de datos, archivos de gran tamaño y archivos de respaldo.
  2. Consolidación de almacenamiento: Permite a las organizaciones consolidar múltiples sistemas de almacenamiento en una única solución centralizada, lo que simplifica la administración y reduce los costos operativos.
  3. Mejora del rendimiento: Facilita un acceso más rápido a los datos, lo que resulta beneficioso para aplicaciones y sistemas que requieren un alto rendimiento y baja latencia, como bases de datos de transacciones en línea y entornos de computación de alto rendimiento.
  4. Facilidad de administración: Permite a los administradores de TI gestionar y supervisar el almacenamiento de manera centralizada, lo que simplifica las tareas de mantenimiento, copia de seguridad y recuperación de datos.

¿Cómo se conecta un servidor a una cabina de discos?

Tanto los servidores como las cabinas de discos SAN están pensadas para ser tolerantes a fallos. Esto quiere decir que si se rompe una tarjeta de fibra de la cabina de discos o del servidor, o un switch de SAN, o un cable de red, por citar tres ejemplos comunes, los sistemas seguirán teniendo acceso a los datos por otros caminos.

¿Cómo se consigue la redundancia de acceso a los datos?

Para conseguir la redundancia de acceso a los datos, se han de cumplir con varios requisitos técnicos tanto a nivel hardware como a nivel software. Veámos cuáles son:

Arquitecura SAN
  • La infraestructura de cabina se ha de componer de varias tarjetas de fibra y switches de fibra.
  • Los servidores deben tener varias tarjetas de fibra, cada una de ellas conectada a un switch de fibra diferente.
  • El sistema operativo ha de tener configurado el acceso a los discos (o LUNs) por diferentes caminos. Esto es lo que, en RedHat, se llama multipath (ver guía de multipath).
  • En caso de entornos con redundancia en varios CPDs, los datos de la cabina de discos se han de poder sincronizar a otra cabina secundaria a través de una línea de red dedicada. Es lo que se conoce como réplica de datos. Obviamente, esta solución también se puede aplicar en el CPD local.

¿Cuáles son las características principales que ha de tener una cabina de discos profesional?

Una cabina de discos profesional, diseñada para aplicaciones empresariales críticas y de alto rendimiento, suele tener una serie de características clave para garantizar la confiabilidad, la seguridad y el rendimiento del almacenamiento de datos. Algunas de estas características importantes incluyen:

  1. RAID (Redundant Array of Independent Disks): La capacidad de implementar configuraciones de RAID para la redundancia y la protección de datos. Los niveles comunes de RAID incluyen RAID 0, RAID 1, RAID 5, RAID 6 y RAID 10, que ofrecen distintos niveles de rendimiento y tolerancia a fallos.
  2. Deduplicación: La capacidad de eliminar duplicados de datos para ahorrar espacio de almacenamiento y optimizar la eficiencia de la capacidad de almacenamiento. Te puede interesar saber cómo funciona la arquitectura VDO en Linux, que es capaz de deduplicar y comprimir datos a nivel de filesystem.
  3. Compresión de datos: La capacidad de comprimir datos para reducir el espacio de almacenamiento necesario y mejorar la eficiencia del almacenamiento.
  4. Snapshot y replicación de datos: La capacidad de crear instantáneas de los datos en un momento específico para fines de copia de seguridad y recuperación. La replicación de datos permite la copia de datos en tiempo real o programada entre ubicaciones geográficas distintas para fines de protección y recuperación ante desastres.
  5. Escalabilidad: La capacidad de escalar el almacenamiento para satisfacer las crecientes demandas de datos sin comprometer el rendimiento.
  6. Alta disponibilidad y tolerancia a fallos: La capacidad de mantener el acceso a los datos incluso en caso de fallos de hardware, ofreciendo opciones de tolerancia a fallos y redundancia de componentes críticos.
  7. Interfaz de red de alta velocidad: La compatibilidad con interfaces de red de alta velocidad, como Fiber Channel o iSCSI, para garantizar un acceso rápido y eficiente a los datos.
  8. Gestión centralizada y capacidades de supervisión: La presencia de herramientas y software de gestión robustos que permitan una administración centralizada del almacenamiento y proporcionen capacidades de supervisión para el rendimiento y la utilización del almacenamiento.
  9. Protección de datos avanzada: Incluye características como el cifrado de datos, la integridad de los datos, la autenticación y el control de acceso para garantizar la seguridad y la privacidad de los datos almacenados.
  10. Compatibilidad con estándares de la industria y certificaciones de seguridad: La conformidad con estándares de la industria y certificaciones de seguridad relevantes para garantizar la interoperabilidad y la protección de los datos sensibles.

Estas características son cruciales para garantizar un almacenamiento de datos seguro, confiable y eficiente en un entorno empresarial profesional.

¿Qué es una zona de la SAN?

Los administradores de las cabinas de discos han de configurar «zonas de discos» asociadas a servidores o, mejor dicho, WWN (Word Wide Names), que son los identificadores únicos de las tarjetas de fibra. De esta manera, un servidor puede ver unas LUNs y no otras.

El WWID o World Wide ID es el identificador único de una LUN (cómo obtener el WWID de cada LUN en Linux RedHat).

La creación de zonas es una práctica común en las redes de almacenamiento para controlar y limitar el acceso de ciertos dispositivos y servidores a determinados recursos de almacenamiento dentro de la SAN.

Las zonas se utilizan para mejorar la seguridad y la eficiencia del sistema, permitiendo a los administradores de la red y del almacenamiento controlar el acceso a los datos y los recursos de almacenamiento de manera más precisa. Esto significa que los dispositivos sólo pueden comunicarse con los recursos de almacenamiento específicos que se les han asignado dentro de una zona determinada.

Las zonas pueden configurarse en función de distintos criterios, como:

  1. Zonas de puerto a puerto: Establecen una comunicación directa entre dos dispositivos específicos, limitando el acceso de otros dispositivos a la conexión.
  2. Zonas de puerto a grupo de puertos: Permiten que un dispositivo se comunique con varios dispositivos o servidores dentro de una misma zona.
  3. Zonas de grupo de puertos a grupo de puertos: Permiten la comunicación entre varios dispositivos o servidores en un grupo específico.

La segmentación de la red mediante el uso de zonas es esencial para garantizar la seguridad de los datos y para optimizar el rendimiento de la SAN, ya que ayuda a evitar problemas de congestión de la red y conflictos de acceso. Además, las zonas permiten un mejor control sobre quién puede acceder a qué datos, lo que mejora la seguridad y la administración de la red de almacenamiento.

¿Quienes son los fabricantes principales de cabinas de discos profesionales?

Algunos de los principales proveedores de soluciones de SAN son:

  1. Dell EMC: Es conocido por ofrecer una amplia gama de soluciones de almacenamiento, incluidas las SAN, que se adaptan a diversas necesidades empresariales, desde PYMES hasta grandes empresas.
  2. Hewlett Packard Enterprise (HPE): HPE ha sido un jugador clave en el mercado de soluciones de almacenamiento, ofreciendo productos como HPE 3PAR y HPE StoreFabric que proporcionan soluciones de almacenamiento SAN confiables y de alto rendimiento.
  3. IBM: IBM ha estado involucrado en el suministro de soluciones de almacenamiento de datos durante décadas, y ha ofrecido una variedad de productos y soluciones de almacenamiento SAN.
  4. NetApp: NetApp ha sido conocido por sus soluciones de almacenamiento innovadoras, incluidas las soluciones SAN, que ofrecen una amplia gama de funciones de almacenamiento y gestión de datos.
  5. Hitachi Vantara: Hitachi Vantara es conocido por sus soluciones de almacenamiento de datos de alta gama, incluidas las soluciones SAN, que se centran en ofrecer un rendimiento excepcional y una gestión eficiente de los datos.
  6. Cisco: Aunque más conocido por sus productos de redes, Cisco también ofrece soluciones de almacenamiento SAN que se integran con su infraestructura de red para proporcionar soluciones completas para entornos empresariales.

¿Qué diferencias suelen haber entre las cabinas de un fabricante y otro?

Las diferencias entre las cabinas SAN de diferentes fabricantes suelen estar determinadas por una variedad de factores, que van desde las especificaciones técnicas hasta las características de software y la integración con otros productos y soluciones del fabricante. Algunas de las diferencias comunes incluyen:

  1. Arquitectura y hardware subyacente: Cada fabricante puede adoptar diferentes enfoques en cuanto a la arquitectura de la SAN y los componentes de hardware utilizados, lo que puede afectar el rendimiento, la capacidad y la escalabilidad de la solución.
  2. Características de software y gestión: Los fabricantes pueden ofrecer diferentes conjuntos de características de software para la administración y el monitoreo de la SAN, como herramientas de gestión de almacenamiento, capacidades de análisis, funciones de replicación y copia de seguridad, entre otros.
  3. Compatibilidad y estandarización: Algunos fabricantes pueden diseñar sus cabinas SAN para trabajar de manera más eficiente con sus propios productos y soluciones, lo que podría afectar la interoperabilidad con productos de otros fabricantes y la estandarización de la infraestructura de TI.
  4. Capacidades de escalabilidad y rendimiento: Las capacidades de escalabilidad y rendimiento de las cabinas SAN pueden variar entre fabricantes en función de la tecnología y los enfoques de diseño utilizados, lo que puede influir en la capacidad de la solución para satisfacer las demandas de crecimiento y rendimiento de las empresas.
  5. Soporte y servicios postventa: Los servicios de soporte y posventa pueden variar entre fabricantes, lo que puede afectar la disponibilidad de asistencia técnica, actualizaciones de software y servicios de mantenimiento a lo largo del ciclo de vida de la solución de almacenamiento.
  6. Precio y costos de propiedad: El precio y los costos de propiedad asociados con las cabinas SAN pueden variar significativamente entre diferentes fabricantes, dependiendo de las características y capacidades específicas de la solución, así como de las ofertas de servicios de valor agregado.

Estas diferencias entre las cabinas SAN de diferentes fabricantes resaltan la importancia de evaluar cuidadosamente las necesidades empresariales específicas y considerar diversos factores, como el rendimiento, la capacidad, la escalabilidad, la compatibilidad y el costo, al seleccionar la solución de almacenamiento más adecuada para una organización determinada.

¿Qué hay que estudiar para ser un administrador de SAN?

Para convertirte en un administrador de Storage Area Network (SAN), generalmente se requiere una combinación de educación formal y experiencia práctica en tecnologías de redes y almacenamiento. A continuación se detallan algunas áreas de estudio y habilidades que son importantes para este campo:

  1. Educación en tecnologías de la información y redes: Obtener una licenciatura o un grado técnico en informática, ingeniería informática, ciencias de la computación o un campo relacionado proporcionará una base sólida en los fundamentos de la tecnología de la información y las redes.
  2. Conocimientos de sistemas operativos y administración de servidores: Familiarizarse con sistemas operativos como Linux, UNIX y Windows Server, así como con la administración de servidores, es esencial para comprender cómo se integran y operan los sistemas de almacenamiento en red.
  3. Conocimientos de almacenamiento y redes: Es fundamental comprender los conceptos y las tecnologías relacionadas con el almacenamiento de datos, incluidos los sistemas de almacenamiento en red, como SAN, NAS (Network Attached Storage), así como los protocolos y estándares asociados, como Fiber Channel, iSCSI, NFS y CIFS.
  4. Habilidades en virtualización y nube: A medida que la virtualización y la computación en la nube continúan siendo parte integral de las operaciones empresariales, es importante comprender cómo los entornos virtuales y en la nube interactúan con las soluciones de almacenamiento.
  5. Conocimientos de seguridad de la información y recuperación ante desastres: Comprender los principios de seguridad de la información y cómo implementar estrategias de recuperación ante desastres es crucial para proteger los datos almacenados en una SAN y garantizar su disponibilidad en caso de interrupciones o fallos.
  6. Certificaciones especializadas: Obtener certificaciones reconocidas en tecnologías de almacenamiento y redes, como las ofrecidas por fabricantes como Cisco, Dell EMC, HPE o CompTIA, puede ayudar a demostrar competencia y conocimientos especializados en el campo de la administración de SAN.

Almacenamiento por Objetos

El almacenamiento por objetos es un enfoque de gestión de datos que se utiliza para almacenar, organizar y recuperar información en forma de objetos en lugar de utilizar la tradicional estructura de archivos jerárquicos utilizada en sistemas de almacenamiento de archivos. Cada objeto contiene datos (como documentos, imágenes, videos o cualquier tipo de archivo), junto con metadatos que describen y etiquetan el objeto. Este enfoque es especialmente adecuado para manejar grandes cantidades de datos no estructurados y distribuidos.

Aquí hay algunas características y conceptos clave del almacenamiento por objetos:

  1. Objetos: En el almacenamiento por objetos, los datos y los metadatos se empaquetan en un único objeto. Cada objeto tiene un identificador único que se utiliza para acceder a él.
  2. Metadatos ricos: Los metadatos asociados a cada objeto pueden ser muy detallados y descriptivos. Esto facilita la búsqueda y la gestión de datos, ya que los metadatos pueden incluir información sobre el contenido, la fecha de creación, el propietario y más.
  3. Escalabilidad: Los sistemas de almacenamiento por objetos están diseñados para escalar horizontalmente, lo que significa que pueden manejar grandes cantidades de datos distribuidos a través de múltiples nodos o servidores. Esto los hace ideales para aplicaciones y cargas de trabajo en crecimiento.
  4. Alto rendimiento: Los sistemas de almacenamiento por objetos suelen ofrecer un alto rendimiento, lo que los hace adecuados para aplicaciones que requieren acceso rápido a grandes cantidades de datos, como el almacenamiento de contenido multimedia o la transmisión de video en línea.
  5. Distribución geográfica: Los objetos pueden replicarse y distribuirse en múltiples ubicaciones geográficas para garantizar la disponibilidad y la recuperación ante desastres.
  6. Acceso a través de API: La mayoría de los sistemas de almacenamiento por objetos ofrecen una interfaz de programación de aplicaciones (API) para permitir a las aplicaciones y servicios interactuar con los objetos y los datos almacenados.
  7. Seguridad: Los sistemas de almacenamiento por objetos suelen incluir funciones de seguridad, como control de acceso, cifrado y autenticación, para proteger los datos almacenados.
  8. Economía de escala: El almacenamiento por objetos es eficiente en cuanto a costos, ya que puede aprovechar el hardware de bajo costo y la capacidad de almacenamiento masivo.

El almacenamiento por objetos se utiliza en una variedad de aplicaciones, como almacenamiento en la nube, archivado de datos, administración de contenido y distribución de medios. Algunos ejemplos de sistemas de almacenamiento por objetos populares incluyen Amazon S3 (Simple Storage Service), Microsoft Azure Blob Storage y Google Cloud Storage, entre otros. Estos servicios son ampliamente utilizados para almacenar y administrar datos en la nube y ofrecen una escalabilidad y durabilidad significativas.

También hay otros productos, como Ceph Storage, que utilizan el almacenamiento por objetos.

¿Existen cabinas de disco en el mercado que utilicen el almacenamiento por objetos?

La respuesta rápida es que sí. Los fabricantes de cabinas de disco han visto su potencial de mercado, dado que los clientes empresariales están demandando, cada vez más, este tipo de almacenamiento. Las cabinas de disco en el mercado que utilizan el almacenamiento por objetos incluyen opciones de empresas como Dell, NetApp y HPE, aunque cada una ofrece una perspectiva única en la implementación de este tipo de almacenamiento.

  1. Dell ECS: El almacenamiento de objetos empresarial ECS de Dell es destacado por su escalabilidad a nivel de exabytes y su alta ciberseguridad, ofreciendo rendimiento extremo y compatibilidad con S3 en una arquitectura distribuida. Está diseñado para soportar cargas de trabajo empresariales que incluyen inteligencia artificial (IA), análisis de datos y archivado a gran escala, y se promociona por reducir el costo total de propiedad (TCO) en comparación con las soluciones de almacenamiento en la nube pública. Además, ECS es compatible con una amplia gama de aplicaciones modernas y está diseñado para almacenar datos no estructurados a escala de cloud pública, ofreciendo fiabilidad y control como si fuera una infraestructura de cloud privada. Más información en: https://www.dell.com/es-es/dt/storage/ecs/index.htm#tab0=0&tab1=0
  2. NetApp: NetApp ofrece soluciones de almacenamiento por objetos y gestión del almacenamiento S3 a través de su plataforma. Aunque no se ha podido acceder a detalles específicos del producto a través del sitio web, se proporciona un enlace de documentación que sugiere que NetApp tiene capacidades para manejar almacenamiento de objetos S3, lo cual es un indicador de su presencia en el espacio de almacenamiento por objetos. Más información en: https://www.netapp.com/es/data-storage/
  3. HPE: Las cabinas HPE D3000 no se describen específicamente como soluciones de almacenamiento por objetos, pero ofrecen un sistema de almacenamiento externo en niveles modulares y de gran capacidad para entornos de aplicaciones pequeñas, oficinas remotas y ubicaciones departamentales. Son soluciones de almacenamiento SAS de 12 Gb que proporcionan una expansión de la capacidad de los entornos de servidores HPE ProLiant y HPE BladeSystem, y pueden aumentar la compatibilidad hasta 96 unidades LFF o 200 unidades SFF. Más información en: https://buy.hpe.com/es/es/storage/disk-storage-systems/c/304616

Cada una de estas soluciones ofrece distintas ventajas y características que se adaptan a las necesidades específicas de almacenamiento de datos de las empresas.

COMPÁRTEME

Deja un comentario