Storage Spaces Direct (S2D) – Parte 1
Storage Spaces Direct (S2D) – Parte 1

Storage Spaces Direct (S2D) – Parte 1

¡Saludos, comunidad de WitcherIT!

En esta oportunidad he decido cambiar mi esquema de presentación, después de más de 5 años creando contenidos para esta hermosa comunidad.

Soy vuestro hechicero tecnológico de confianza, listo para desvelar los secretos de una de las herramientas más potentes del arsenal de Microsoft para la infraestructura moderna: ¡Storage Spaces Direct (S2D)!

Hoy nos sumergiremos en las profundidades de esta tecnología para entender qué es, cómo funciona y por qué podría ser la clave para una próxima gran implementación.

Veremos en una serie de post (Aun no he definido cuantos), aunque por lo mínimo serán tres post. ¡Preparen sus grimorios de sistemas, que empezamos!

!IMPORTANTE!

En esta serie abordaré la tecnología Storage Spaces Direct (S2D) haciendo referencia a implementaciones físicas y virtuales, por razones casi obvias la demostraciones serán en un entorno virtual, lamentablemente no tengo 2 o 3 servidores físicos para demostrar de mejor manera esta tecnología.

¿Qué es Storage Spaces Direct?

Storage Spaces Direct es una solución de almacenamiento definida por software que permite compartir recursos de almacenamiento en la infraestructura de TI convergente e hiperconvergente. Nos permite combinar unidades de almacenamiento interno en un clúster de servidores físicos (2 y hasta 16) en un grupo de almacenamiento definido por software. Este grupo de almacenamiento tiene caché, tiers, resiliency y erasure coding en todas las columnas, todo configurado y administrado automáticamente.

Podemos escalar horizontalmente la capacidad de almacenamiento del clúster agregando más unidades o agregando más servidores en el clúster. Storage Spaces Direct incorpora automáticamente las nuevas unidades y reequilibra el storage pool. También, utiliza automáticamente los medios de almacenamiento más rápidos presentes para proporcionar caché integrada y siempre activa.

Storage Spaces Direct es una tecnología principal de Azure Stack HCI, versiones 21H2 y 20H2. También, se incluye en las ediciones Datacenter de Windows Server 2022, Windows Server 2019, Windows Server 2016, Windows Server Insider Preview Builds y Azure Edition de Windows Server 2022.

Podemos implementar Storage Spaces Direct en un clúster de servidores físicos o en virtual machine (VM) guest clusters. Si se implementa en un clúster hiperconvergente de servidores físicos, se recomienda usar servidores Azure Stack HCI.

La implementación de Storage Spaces Direct en VM guest clusters ofrece almacenamiento compartido virtual en un conjunto de máquinas virtuales sobre una nube privada o pública. En entornos de producción, esta implementación solo se admite en Windows Server.

Sin entrar en un nivel de complejidad abrumador, veamos las piezas clave de Storage Spaces Direct:

  • Hardware: Necesitamos servidores (mínimo 2, recomendado 3-4 para empezar en producción) certificados para S2D, cada uno con unidades locales. Estas unidades pueden ser una mezcla de NVMe, SSD y HDD para crear niveles de almacenamiento (tiering) o configuraciones all-flash.
  • Red: Una red rápida y fiable (RDMA como RoCE o iWARP sobre 10GbE o más rápido es altamente recomendado) es crucial para la comunicación entre nodos del clúster, especialmente para el tráfico de almacenamiento.
  • Clúster de Conmutación por Error (Failover Clustering): Es la base que agrupa los servidores y proporciona la alta disponibilidad.
  • Software Storage Bus (Bus de Almacenamiento de Software): Una vez habilitado S2D, este componente “virtual” permite a todos los servidores del clúster ver todos los discos locales de todos los demás servidores. ¡Es como si todos los discos estuvieran en un gran chasis compartido!
  • Storage Pool (Grupo de Almacenamiento): Todos los discos disponibles a través del Software Storage Bus se agrupan en un único “pool” de capacidad.
  • Storage Spaces (Espacios de Almacenamiento): Desde este “pool”, creas “volúmenes” o “discos virtuales” (conocidos como Espacios de Almacenamiento). Aquí es donde defines el nivel de resiliencia (mirror, parity) y si usarás niveles de almacenamiento (por ejemplo, un nivel de caché SSD y un nivel de capacidad HDD).
  • Resilient File System (ReFS): Es el sistema de archivos recomendado sobre estos volúmenes. ReFS está optimizado para la virtualización y ofrece características como la detección y corrección acelerada de corrupción de datos.
  • Scale-Out File Server (SOFS) (Opcional pero común): Para exponer el almacenamiento a través de la red usando SMB3 (para Hyper-V, SQL Server, etc.), a menudo se implementa el rol de Scale-out File Server.

Casos de Uso de S2D

Existen dos modelos de implementación principales:

Hyperconverged (HCI):

Los recursos de cómputo (máquinas virtuales Hyper-V) y el almacenamiento S2D residen en los mismos servidores del clúster. Es la opción más popular por su simplicidad y eficiencia de costes.

Converged (o disaggregated):

El almacenamiento S2D se ejecuta en un clúster separado, y los recursos de cómputo (en otro clúster) acceden a él a través de la red mediante un Scale-Out File Server. Esto ofrece más flexibilidad para escalar cómputo y almacenamiento de forma independiente.

Los Pilares Fundamentales de S2D

Para entender la magia detrás de S2D, debemos fijarnos en sus componentes y ventajas clave:

Simplicidad y Coste-Efectividad:

  • S2D utiliza hardware estándar de la industria (servidores x86 con unidades locales SATA, SAS, NVMe). Esto reduce la dependencia de costosas implementaciones SAN y NAS con equipos dedicados.
  • La configuración y gestión se integran con las herramientas que ya conocemos de Windows Server, como el Failover Cluster Manager  y PowerShell.

Rendimiento Excepcional:

  • S2D está diseñado para el rendimiento. Soporta las últimas tecnologías de almacenamiento, incluyendo unidades NVMe (Non-Volatile Memory Express) y memoria persistente (PMem) para niveles de caché ultrarrápidos.
  • Incorpora un bus de almacenamiento definido por software y una caché de bus de almacenamiento que acelera significativamente las operaciones de lectura y escritura, manteniendo los datos más calientes (los más accedidos) en los medios más rápidos.

Alta Disponibilidad y Resiliencia:

  • S2D está construido sobre los cimientos del Clúster de Conmutación por Error de Windows Server. Los datos se distribuyen y se replican (mediante espejos de dos o tres vías, o paridad simple/doble) entre los diferentes discos y servidores del clúster.
  • Si un disco falla, S2D puede reconstruir los datos afectados utilizando las copias redundantes. Si un nodo (servidor) completo se cae, el almacenamiento sigue estando disponible desde los nodos restantes.

Escalabilidad Flexible:

  • Podemos empezar con tan solo 2 servidores (aunque 3 o 4 es lo más común para producción) e ir añadiendo más servidores (escalabilidad horizontal) o más unidades a los servidores existentes (escalabilidad vertical) a medida que nuestras necesidades crezcan.
  • La capacidad de escalar de forma granular y predecible es una de sus grandes fortalezas de Storage Spaces Direct.

Gestión y supervisión

Podemos usar las siguientes herramientas para administrar y supervisar Storage Spaces Direct. Si llega a interesarles esta tecnología podemos revisar en próximos post como usar estas herramientas con Storage Spaces Direct.

NameGraphical or command-line?Paid or included?
Windows Admin CenterGraphicalIncluded
Server Manager & Failover Cluster ManagerGraphicalIncluded
Windows PowerShellCommand-lineIncluded
System Center Virtual Machine Manager (SCVMM) & Operations ManagerGraphicalPaid

Conclusión

Para entornos que buscan modernizar su infraestructura, especialmente para cargas de trabajo virtualizadas con Hyper-V o bases de datos SQL Server, S2D ofrece una propuesta de valor muy atractiva. La reducción de costes en hardware propietario, la simplificación de la gestión (una vez que logramos entender bien su funcionamiento) y la escalabilidad son puntos muy fuertes a tener en cuenta para una implementación de almacenamiento definido por software.

Requiere una planificación cuidadosa de la red, del hardware (es vital usar Windows Server Catalog validado para S2D o Azure Stack HCI) y un buen entendimiento de los conceptos de clustering y almacenamiento definido por software.

Si estás considerando una renovación de tu infraestructura de almacenamiento o buscando una solución HCI potente sobre la plataforma Microsoft, ¡definitivamente debes investigar S2D!

Lista de post de esta serie:

  • Storage Spaces Direct (S2D) – Parte 1
  • Storage Spaces Direct (S2D) – ¿Por Qué Preocuparse por la Tolerancia a Fallos? – Parte 2
  • Deploy de Storage Spaces Direct – Parte 3

Espero que esta información pueda ser de ayuda, y cualquier duda o sugerencia la dejan en los comentarios. Saludos.

Leave a Reply

Your email address will not be published. Required fields are marked *