clusterlion-banner

splitbrain

Herausforderung

Cluster Technologie

Auch bei Cluster Systemen gibt es Szenarien, wo das zentrale System ausfallen kann und dadurch IT-Services nicht mehr funktionieren.

Cluster Systeme erfordern einen shared Storage mit synchroner Datenspiegelung über zwei Standorte, um ein Höchstmaß an Verfügbarkeit zu garantieren. Sollten Hardwarekomponenten ausfallen, können die darauf laufenden Applikationen am zweiten Standort weiter betrieben werden. Doch auch in der Cluster Technologie gibt es Szenarien, wo das zentrale System ausfallen kann. Die Konsequenz: unternehmenskritische IT-Services funktionieren nicht mehr.

Herausforderung Stromausfall

Wussten Sie, dass Ihr Storage Cluster bei einem Stromausfall an einem Standort nicht mehr in der Lage ist, seine Services automatisch an seinen Clusterpartner zu übergeben?

Herausforderung Split Brain Syndrom

Der Storage Cluster kann nicht zwischen einem Gesamtausfall des Clusterpartners oder einer Unterbrechung der Interconnects unterscheiden. Im Zweifelsfall werden keine Services übernommen.

Der Grund ist technologisch bedingt: der Storage Cluster kann bei Stromausfall nicht unterscheiden, ob nur die Interconnects zwischen den Standorten unterbrochen sind, oder ob es sich um einen Gesamtausfall des Clusterpartners handelt. Um das Risiko einer Cluster Inkonsistenz auszuschließen, werden keine Services vom jeweils anderen Standort übernommen.

Man spricht von Split Brain Syndrom, wenn die Interconnects zwischen zwei Cluster Partnern unterbrochen sind. Falls in diesem Zustand eine Cluster Übernahme durchgeführt wird, befindet sich eine Identität zweimal im selben Cluster und dabei werden Transaktionen auf unterschiedlichen Volumes abgearbeitet. Diese können später nicht mehr zusammengeführt werden und das führt zu Datenverlust. Unter Split Brain Konditionen findet keine automatische Cluster Übernahme satt und Ihre unternehmenskritischen IT-Services Services fallen aus.

Drei-Standorte-Konzept

Mögliche Abhilfe schafft ein eigenes drittes Rechenzentrum, das die beiden Standorte überwacht und bei Ausfall die Serviceübergabe an den verbleibenden Clusterpartner einleitet. Die Herausforderungen liegen in den hohen Kosten durch zusätzliche Räumlichkeiten sowie redundante LAN und SAN Verbindungen, und in der erhöhten Komplexität. Auch bleibt das Restrisiko einer Inkonsistenz durch Split Brain weiter bestehen.



Die Lösung: Hochverfügbarkeit durch ClusterLion

Sie betreiben Online-Shops, Produktionssteuerungssysteme, Netbanking oder andere unternehmenskritische Applikationen, welche rund um die Uhr verfügbar sein müssen? Hier sind Sie richtig, ClusterLion erhöht die Verfügbarkeit Ihrer wichtigen Applikationen!

Cluster Technologie bietet ein hohes Maß an Verfügbarkeit, dennoch können selbst in gespiegelten Cluster Systemen Ausfall-Szenarien eintreten. Sie können sich davor schützen. Hier erfahren Sie, wie das geht.

ClusterLion sichert Ihren NetApp MetroCluster, denn ein Ausfall kostet Geld und Image

Die Verfügbarkeit für Ihren Storage Cluster und Ihre unternehmenskritischen Applikationen wird erhöht.

ClusterLion ist einfach implementiert

Sie benötigen nur zwei Rechenzentrumsstandorte, das reduziert Kosten und Komplexität. Die Installation erfolgt unterbrechungsfrei im Betrieb.

Wir sind erfahrene und leidenschaftliche Storage-Experten

Für Ihre Sicherheit entwickeln wir innovative Lösungen. Setzen Sie den entscheidenden Schritt für die Hochverfügbarkeit Ihres Clusters.

lifebelt



Funktion

Als einziger am Markt bietet ClusterLion höchste Verfügbarkeit mit einem zwei-Standorte-Konzept und gewährleistet auch in einem Split Brain Szenario jederzeit die Datenkonsistenz im Cluster.

Funktionsweise

Sie können ClusterLion jederzeit unterbrechungsfrei im Betrieb an Ihrem bestehenden NetApp MetroCluster nachrüsten.

Nach Inbetriebnahme überwacht ClusterLion permanent die Stromversorgung, die Interconnects, sowie ausgewählte Dienste des Storage Clusters.

Falls plötzlich Cluster Dienste von einem Ausfall betroffen sind, wird dies sofort erkannt und entsprechend reagiert.

Als erste Maßnahme trennt ClusterLion die Stromversorgung zum betroffenen Clusterknoten und stellt dadurch einen konsistenten Zustand im MetroCluster her. Zusätzlich wird damit ein unbeabsichtigter Wiederanlauf des Cluster-Knotens ausgeschlossen.

Als zweiter Schritt wird die Übernahme der Cluster Services auf den funktionierenden Standort über eigene UMTS Verbindungen von ClusterLion eingeleitet.

Ihre Dienste laufen nun sicher und geordnet am funktionierenden Standort weiter – Hochverfügbarkeit durch ClusterLion.



netapp-compatible


Was sagen unsere Kunden?

Durch einen Stromausfall im übergeordneten Mittelspannungsnetz waren unsere beiden RZs für eine gute halbe Stunde ohne Strom. Leider trat zeitgleich in einer der beiden USVs ein Akkuschaden auf, der in der Folge die Notversorgung eines der RZs auf 5min verkürzte ... das war zu wenig!

Unser zentraler Datenspeicher wird von einem NetApp MetroCluster bereitgestellt welcher permanent von einer ClusterLion Lösung überwacht wird.
Durch ClusterLion erfolgte der MetroCluster Switchover vollautomatisch innerhalb weniger Sekunden und der Zustand des MetroClusters war dank redundanter GSM/ LTE Verbindungen jederzeit einsehbar, obwohl bedingt durch den Stromausfall zusätzlich ein partieller Netzwerkausfall vorlag.

Der Rückschwenk der Storage Dienste erfolgte zügig und unkompliziert. Hilfreich war hier das ClusterLion Portal welches die entsprechenden ONTAP Befehle direkt vorgegeben hat, was im Team für zusätzliche Sicherheit sorgte. Eine tatkräftige Unterstützung durch den ProLion Support war für uns das „Sahnehäubchen" oben drauf! ;-)

Ergebnis: Keine Ausfallszeiten und geringer personeller Aufwand!

Steffen Loos, Helmholtz-Zentrum Potsdam


GFZ-Saeulenforum

Quelle: GFZ












Ihre Vorteile auf einen Blick

  • ClusterLion wacht schützend über Ihren Cluster, denn ein Ausfall kostet Geld und Image.
  • ClusterLion erhöht die Verfügbarkeit für Ihren Storage Cluster und damit für Ihre unternehmenskritischen Applikationen und Daten.
  • Sie sparen Kosten und reduzieren die Komplexität mit dem Zwei-Standorte-Konzept.
  • Selbst bei einem gesamten Stromausfall an einem Standort werden die Cluster Services ordnungsgemäß übergeben und alle Applikationen bleiben verfügbar.
  • Ein Datenverlust im Split Brain Szenario wird durch ClusterLion ausgeschlossen.
  • An jedem bestehenden Storage Cluster kann ClusterLion unterbrechungsfrei nachgerüstet werden. Wenige Stunden Implementierungsaufwand für höchste Verfügbarkeit.
idea-rise