Enhanced S. C. – Teil 2 (Warum und Voraussetzungen)

Der enhanced Mode Stretched Cluster ist seit der Version 7.2 optional verfügbar, d.h. er kann zusätzlich bei einem bestehenden Standard Stretched Cluster (non-enhanced Mode) implementiert werden.

Dieser Beitrag beschreibt die Motivation für den enhanced Mode (WARUM) und die Rahmenbedingungen (VORAUSSETZUNGEN) bei den SVC Versionen 7.2 und 7.3.

Einführung:

  • Non-enhanced Mode Stretched Cluster:
    Der klassische Mode wird in der SVC Terminologie als „standard“ Topologie bezeichnet, obwohl das Setup bereits ge-„stretched“ ist:
    CLI:> chsystem –topology standardDer klassische (non-enhanced) Mode (-topology standard) ist voreingestellt.
  • Enhanced Mode Stretched Cluster:
    Der enhanced Mode wird in der SVC Terminologie als „stretched“ Topologie geführt; „stretched“ Mode bedeutet also enhanced Mode;
    CLI:> chsystem –topology stretched
  • Wechsel zwischen den beiden Modi:
    Zwischen den beiden Modi kann online gewechselt werden. Das Verhalten des Clusters ändert sich dann entsprechend.

Warum:

Der enhanced Mode bringt folgende Funktionalitäten:

  • Erweiterte Disaster Recovery Fähigkeit:
    Durch sehr seltene Ereignisse (z.B. Doppelfehler, rolling Disasters oder Fehler, die sich langsam ausbreiten) können Situationen entstehen, die eine gleichzeitige Nichtverfügbarkeit der aktiven Quorum Disk UND eines RZs mit sich bringen:Beispiel:
    – aktive Quorum Disk in Site 3 fällt aus.
    – Der Cluster ernennt den Quorum Candidate z.B. in Site 2 zur neuen aktiven Quorum Disk.
    – Der Ausfall in Site 3 wird nicht sofort korrigiert.
    – Ein paar Tage später fällt die Stromversorgung in Site 2 aus.
    – Somit geht die dann aktive Quorum Disk und Site 2 gleichzeitig außer Betrieb.

    Was passiert in diesem Fall:
    Obwohl in Site 1 alle Daten konsistent vorhanden sind, gehen alle VDisks offline, da die SVC Nodes in Site 1 in diesem Fall annehmen müssen, dass Site 2 noch läuft und nur die Kommunikation zur Site 2 gestört ist.

    Im non-enhanced Mode hat der SVC Administrator keine Möglichkeit, die VDisks online zu schalten. Die ausgefallene aktive Quorum Disk in Site 2 muss wieder aktiviert werden (falls noch möglich); erst dann werden die VDisks wieder verfügbar. Sollte die aktive Quorum Disk nicht aktivierbar sein, muss der SVC Support aktiviert werden.

    Im enhanced Mode gibt es für diesen Fall einen CLI-Befehl, mit dem der SVC Administrator die VDisks mit den SVC Nodes der Site 1 aktivieren kann. Dieser Vorgang nennt sich „Quorum Override“.

  • Site Awareness mit Bandbreitenoptimierung:
    SVC Knoten und Speichersysteme können ab Version 7.2 mit Site-Attributen versehen werden:
    – SVC Knoten: Site 1 oder Site 2 (CLI:> chnode –site x)
    – Speichersysteme: Sites 1, 2 oder 3 (CLI:> chcontroller –site x)Bereits das Setzen von Site-Attributen bewirkt erste Änderung des IO-Routings innerhalb des SVCs.

    Erst wenn für alle SVC Nodes und Speichersysteme das Site-Attribut gesetzt wurde, läßt sich der Cluster in den enhanced Mode schalten (CLI:> chsystem –topology stretched).

    Folgende Bandbreitenoptimierungen sind im enhanced Mode aktiv:
    Read-Misses erfolgen von Speichersystemen der lokalen Site, falls die Daten dort vorhanden und gültig sind. Dies spart Bandbreite zwischen den Sites und reduziert die Read-Latency.

    Bei Version 7.2 werden Write-IOs zwei Mal zwischen den Sites übertragen (für Cache-Mirror und für Remote-Destage-to-Disk). Ab Version 7.3 werden Write-IOs nur noch 1 mal zwischen den Sites übertragen, da für den Remote-Destage-to-Disk die vorher bereits übertragene Cache-Mirror-Kopie verwendet wird). Dies spart ebenfalls Bandbreite zwischen den Sites 1 und 2.

Voraussetzungen:

  • Fertig implementierter und betriebsbereiter SVC Stretched Cluster im non-enhanced Mode
  • non-ISL Setup oder ISL Setup
  • SVC Version mindestens 7.2, empfohlen 7.3
  • Empfohlen sind mindestens 4 SVC Nodes im Cluster (siehe Beitrag „enhanced mode – Teil 1“)
  • Alle IO-Groups müssen mit einem Node in Site 1 und einem Node in Site 2 betrieben werden. Sonderfälle (z.B. eine IO-Group in Site 3) sind nicht möglich.

Sind diese Voraussetzungen erfüllt, empfehle ich die Verwendung des enhanced Modes in Betracht zu ziehen.

Grüße aus München, Franz.

Advertisements