DE69614623T2

DE69614623T2 - Fehlertolerantes multiples Netzwerkserver

Info

Publication number: DE69614623T2
Application number: DE69614623T
Authority: DE
Inventors: John M. Hemphill; Thomas S. Lawler; Gregory M. Stewart
Original assignee: Compaq Computer Corp
Current assignee: Compaq Computer Corp
Priority date: 1995-06-19
Filing date: 1996-06-12
Publication date: 2002-04-18
Anticipated expiration: 2016-06-13
Also published as: US5781716A; US5696895A; EP0760503B1; DE69614623D1; EP0760503A1

Description

Die vorliegende Erfindung betrifft fehlertolerante Konfigurationen von Netzwerkservern und insbesondere mehrere aktive Server, die gleichzeitig Backupfähigkeiten vorsehen.
Seit ihren Anfängen als Personal- oder Desktopcomputer haben Mikroprozessor-basierte Computersysteme große Entwicklungen durchlaufen, um die sich stets erweiternden Anforderungen von Datenverarbeitungssystemen zu erfüllen. Netzwerke aus Mikroprozessor-basierten Computern erfüllen heute Aufgaben, die früher die exklusive Domäne von Großrechnern war. Leistungsstarke Mikroprozessor-basierte Computer können als Server in Netzwerken mit mehreren hundert Personalcomputern verwendet werden. Diese Netzwerke sehen leistungsstarke verteilte Rechenfähigkeiten in Verbindung mit einem zentralisierten Zugriff auf Daten und direkten Kommunikationen zwischen den Personalcomputern im Netzwerk vor.
Die Erweiterung des Mikroprozessor-basierten Computersystems in den Bereich der Großrechner ist jedoch nicht unproblematisch. Großrechner sind traditionell zuverlässig und extrem "fehlertolerant", so dass der Ausfall eines Teils des Großrechnersystems keinen Datenverlust oder übermäßige Auszeiten zur Folge hat. Fehlertoleranz war lange Zeit eine exklusive Stärke der Großrechnerwelt. Mit dem Vordringen von Mikroprozessor-basierten Netzwerken in diesen Bereich, verlangen Netzwerkbenutzer jedoch zunehmend, dass ihre Netzwerke eine Fehlertoleranz bieten, wie sie sie von Großrechnern her kennen.
Deshalb haben Entwickler eine Anzahl von Schemata entwickelt, um Fehlertoleranz in Kleincomputer-Netzwerken vorzusehen. Ein Netzwerk umfasst üblicherweise Netzwerk Netzwerkhardware, Workstations und einen oder mehrere Server, die jeweils ihr eigenes Massenspeicher-Subsystem aufweisen. Die Server sind ein Eckstein des gesamten Systems, da sie für die Daten und die Kommunikation zwischen den verschiedenen Workstations sorgen. Wenn einer der Server ausfallen oder sein Massenspeicher- Subsystem verlustig gehen sollte, kann dadurch das gesamte Netzwerk außer Betrieb gesetzt werden.
Um die Fehlertoleranz von derartigen Servern zu verbessern, bieten Händler eine Anzahl von fehlertoleranten Systemen an. Ein derartiger Standard ist "SFT III" (System Fault Toleranz Level 3), ein Serverbetriebssystemstandard, der von Novell, Incorporated gestützt wird. IN diesem Netzwerkbetriebssystem ("NOS") besteht jeder "virtuelle" Server tatsächlich aus zwei Servern, die im Tandembetrieb laufen und kontinuierlich die Daten und Prozessoroperationen des anderen Servers spiegeln. Wenn einer dieser physikalischen Server ausfällt, läuft der andere weiter. Das System ist teuer, da es identische Hardware und eine Hochgeschwindigkeits-Optikverbindung zwischen den physikalischen Servern erfordert.
Die DFT III-Lösung ist häufig übermäßig kostspielig und sieht in Anbetracht der Bedürfnisse von durchschnittlichen Benutzern einen übermäßigen Schutz vor. Derartige Benutzer benötigen meist keine sofortige Wiederherstellung nach einem Servercrash, wie sie SFT III vorsieht. Deshalb haben einige Händler Systeme entwickelt, in denen bei Ausfall des primären Servers ein Standby-Server den Betrieb des primären Servers nicht unmittelbar, sondern erst nach einer kurzen Zeitperiode übernimmt. Dieser Standby-Server kann weniger kostspielige und etwas langsamere Hardware als der primäre Server verwenden, wodurch die Gesamtkosten herabgesetzt werden. Ein derartiges System wurde von NetGuard Systems, Incorporated eingeführt.
Alle diese Systeme sehen jedoch einen redundanten, im normalen Betrieb nicht genutzten Server vor. Es sind also zwei physikalische Server erforderlich, die allerdings nur als ein einziger logischer Netzwerkserver betrieben werden können. Das ist beim Spiegeln des SFT III-Systems oder beim Backupprinzip des NetGuard-Systems der Fall. Implementierer, Administratoren und Benutzer von Netzwerken möchten jedoch die Serverleistung maximieren. Auch bei Netzwerken mittlerer Größe, werden häufig große Anforderungen an Server gestellt, so dass für eine entsprechende Leistung mehrere Server erforderlich sind. Jeder zusätzliche Server erzeugt jedoch Kosten, so dass ein großer Bedarf nach einem System besteht, dass Kosten reduziert und gleichzeitig Fehlertoleranz und eine größere Rechenleistung bietet.
Aus WO-A-91/17506 ist bekannt, eine Redundanz zwischen Plattenlaufwerk-Controllern der zweiten Ebene in einem Computersystem vorzusehen, das Plattenlaufwerk-Controller der ersten und der zweiten Ebene umfasst, so dass ein Controller der ersten Ebene Plattenlaufwerk-Steuersignale über einen anderen Controller der zweiten Ebene umleiten kann, wenn der normalerweise mit ihm assoziierte Controller der zweiten Ebene ausfällt.
Das Dokument EP-A-0 709 779 ist Stand der Technik nach Artikel 54(3) EPc.
Gemäß der vorliegenden Erfindung ist ein duales, fehlertolerantes aktives Serversystem für ein Netzwerk angegeben, wobei das System umfasst:
einen ersten aktiven Server zur Verbindung mit dem Netzwerk, wobei der erste aktive Server eine erste Anzeige dahingehend, dass er ordnungsgemäß funktioniert, ergehen lässt;
einen zweiten aktiven Server zur Verbindung mit dem Netzwerk, wobei der zweite aktive Server die erste Anzeige von dem ersten aktiven Server empfängt und der zweite Server eine zweite Anzeige an den ersten Server dahingehend, dass er ordnungsgemäß funktioniert, ergehen lässt, und wobei der erste aktive Server (100) einen ersten Umschaltbefehl ergehen lässt, wenn der zweite aktive Server die zweite Anzeige dahingehend, dass der zweite aktive Server ordnungsgemäß funktioniert, nicht ergehen lässt, und wobei der zweite aktive Server einen zweiten Umschaltbefehl ergehen lässt, wenn der erste aktive Server die erste Anzeige dahingehend, dass der erste aktive Server ordnungsgemäß funktioniert, nicht ergehen lässt;
ein erstes Speichersystem mit ersten Speichermedien, wobei das erste Speichersystem vorrangig die ersten Speichermedien mit dem ersten aktiven Server verbindet und als Alternative dazu die ersten Speichermedien mit dem zweiten aktiven Server verbindet und die ersten Speichermedien beim Empfang des zweiten Umschaltbefehls von dem zweiten aktiven Server von dem ersten aktiven Server trennt; und
ein zweites Speichersystem mit zweiten Speichermedien, wobei das zweite Speichersystem vorrangig die zweiten Speichermedien mit dem zweiten aktiven Server verbindet und als Alternative dazu die zweiten Speichermedien mit dem ersten aktiven Server verbindet und die zweiten Speichermedien beim Empfang des ersten Umschaltbefehls von dem ersten aktiven Server von dem zweiten aktiven Server trennt.
Die beiden aktiven Server sehen also wechselseitig Backup-Fähigkeiten füreinander vor. Ein erster Netzwerkserver ist online bzw. aktiv und bietet den Netzwerkbenutzern Serverzugriff über ein Netzwerkbetriebssystem; gleichzeitig ist auch ein zweiter Netzwerkserver online bzw. aktiv und dient den Netzwerkbenutzern als ein zweiter unabhängigen Server. Jeder Server ist mit einem Speichersystem wie etwa einer Disk-Array verbunden, um Daten für den Netzwerkbenutzerzugriff zu speichern. Jeder Server ist weiterhin mit dem Speichersystem des anderen Servers verbunden und kann erzwingen, dass das andere Speichersystem von dem anderen Server zu sich "umschaltet".
Die Server überwachen jeweils den kontinuierlichen Betrieb des anderen Servers. Sollte ein Server ausfallen, veranlasst der andere Server, dass das Speichersystem des ausgefallenen Servers zu dem noch laufenden Server umschaltet. Der noch laufende Server bedient dann die Laufwerke oder anderen Medien in dem neu übernommenen Speichersystem, informiert die laufenden Anwendungen über die neuen Laufwerke und fährt mit dem Betrieb fort, wobei er nicht nur seine eigenen Aufgaben, sondern auch diejenigen des anderen, ausgefallenen Servers erfüllt.
Auf diese Weise ist während des normalen Betriebs die kombinierte Leistung beider Server verfügbar, die jeweils separate, aktive Server sind. Wenn einer der Server ausfällt, fährt der andere Server fort, Zugriff sowohl auf sein eigenes Speichersystem als auch auf das Speichersystem des ausgefallenen Servers zu gewähren, so dass alle gespeicherten Daten für die Netzwerkbenutzer verfügbar sind, wenn auch mit reduzierter Leistung.
Diese Technik und das System mit den aktiven Backup-Server-Fähigkeiten kann zu einem System erweitert werden, in dem mehr als zwei aktive Server wechselseitige Backup- und Wiederherstellungsfähigkeiten bieten.
Auf diese Weise ist während des normalen Betriebs die volle Rechenleistung jedes Servers verfügbar, wobei trotzdem jeder Server ein aktives Backup für den anderen leistet.
Die vorliegende Erfindung wird durch die folgende ausführliche Beschreibung einer bevorzugten Ausführungsform mit Bezug auf die beigefügten Zeichnungen verdeutlicht:
Fig. 1 ist ein Blockdiagramm, das den Betrieb des Mehrfach-Backupserversystems gemäß der vorliegenden Erfindung darstellt,
Fig. 2A-2E sind Flussdiagramme eines Wiederherstellungsagentendienstes, der auf beiden Servern von Fig. 1 gemäß der vorliegenden Erfindung ausgeführt wird,
Fig. 3 ist ein Flussdiagramm eines Anwendungsagenten, der mit dem Wiederherstellungsagentendienst von Fig. 2A-2E kommuniziert, um zu bestimmen, wann einer der Server von Fig. 1 auf einen Ausfall des anderen Servers folgend neue Laufwerke übernommen hat, und
Fig. 4 ist ein Blockdiagramm, das alternative Ausführungsformen des Serversystems von Fig. 1 darstellt.
Fig. 1 ist ein Blockdiagramm, das den Betrieb eines Mehrfach-Backupserver-Systems gemäß der vorliegenden Erfindung darstellt.
Ein erster Server 100 und ein zweiter Server 200 sind mit einem Netzwerk N als aktive Netzwerkserver verbunden. Während des normalen Betriebs sind beide Server 100 und 200 in dem Sinne aktiv, dass sie Benutzern des Netzwerks N mit jeweils unabhängiger Netzwerkfunktionalität zur Verfügung stehen. Der erste Server 100 bietet den Netzwerkbenutzern aktiv Zugriff auf Daten in einem umschaltbaren Platten-Subsystem 102, während der zweite Server 200 aktiv einen ähnlichen Zugriff auf die Daten in einem umschaltbaren Platten- Subsystem 202 bietet. Vorzugsweise sind die umschaltbaren Platten-Subsysteme 102 und 202 keine Boot-Platten für den ersten Server 100 und den zweite Server 200. Statt dessen umfasst der erste Server 100 eine lokale Platte 104 und umfasst der zweite Server 200 eine lokale Platte 204. Diese lokalen Platten 104 und 204 enthalten vorzugsweise jeweils eine Netzwerkbetriebssystem-(NOS)-Software und Anwendungssoftware, wobei die umschaltbaren Platten-Subsysteme 102 und 202 als Datenbankspeicher, Dokumentspeicher sowie als Speicher für andere Daten reserviert sind, die keine Programm-orientierten Daten sind.
Der erste Server 100 führt eine Anzahl von Programmen und Tasks aus. Dazu gehören ein Anwendungsprogramm 106, das NOS 108, ein Wiederherstellungsagent 110, der mit einem ähnlichen Wiederherstellungsagenten 210 in dem zweiten Server 200 kommuniziert. Der zweite Server 200 kann in ähnlicher Weise eine Anwendung 206, ein NOS 208 und den Wiederherstellungsagenten 210 ausführen. Die Wiederherstellungsagenten 110 und 210 bieten die Fähigkeiten zum Überwachen und Wiederherstellen eines ausgefallenen Servers gemäß der vorliegenden Erfindung. Sie kommunizieren allgemein über einen seriellen Anschluss (nicht gezeigt) und über eine serielle Verbindung 150. Die Wiederherstellungsagenten 110 und 210 werden mit Bezug auf die Zeichnungen 2A-2E ausführlicher beschrieben und umfassen eine Überwachungseinrichtung für ein "Heartbeat"-Signal des jeweils anderen Servers. Sollte der Wiederherstellungsagent 110 oder 210 in dem anderen Server keinen Heartbeat senden, veranlasst der andere Wiederherstellungsagent 110 oder 210, dass das NOS 108 oder 208 die Kontrolle über das umschaltbare Platten-Subsystem 102 oder 202 des ausgefallenen Servers übernimmt.
Vorzugsweise umfasst der Server 100 zwei Platten-Controller. Ein primärer Controller 112 kommuniziert vorzugsweise über einen SCSI-Bus 114 mit einem Port am umschaltbaren Platten-Subsystem 102. Ein Wiederherstellungs-Controller 116 kommuniziert über einen SCSI-Bus 118 und über einen Port an dem umschaltbaren Platten-Subsystem 202 mit dem zweiten umschaltbaren Platten-Subsystem 202. Der zweite Server 200 enthält entsprechend einen primären Controller 212 und einen Wiederherstellungscontroller 216, der ähnlich über einen SCSI-Bus 214 mit dem zweiten umschaltbaren Platten-Subsystem 202 und über einen SCSI-Bus 218 mit dem ersten umschaltbaren Platten-Subsystem 102 kommuniziert. Obwohl jeweils zwei SCSI-Controller in den Servern 100 und 200 gezeigt sind, könnten diese auch als ein einziger Controller mit umschaltbaren SCSI-Busverbindungen implementiert werden.
Aber weil die umschaltbare Platten-Subsysteme 102 und 202 allgemein eine große Anzahl von Platten mit mehrfachen SCSI-Adressen enthalten, könnte dies die Anzahl der Platten in den umschaltbaren Platten-Subsystemen 102 und 202 beschränken, so dass vorzugsweise zwei Controller 112 und 116 in dem ersten Server 100 sowie zwei Controller 212 und 216 in dem zweiten Controller 200 verwendet werden. Entsprechend können mehrere primäre Controller und Wiederherstellungscontroller in den Servern 100 und 200 implementiert sein, um mehrere umschaltbaren Platten-Subsysteme zu schalten.
Jeder Server 100 und 200 enthält also einen Controller für und Verbindungen zu jedem der umschaltbaren Platten-Subsysteme 102 und 202. Während des normalen Betriebs steuert der Controller 100 die Platten in dem umschaltbaren Platten-Subsystem 102 über den SCSI- Bus 114 mittels seines primären Controllers 112. Der Wiederherstellungscontroller 116 ist physikalisch über den SCSI-Bus 118 mit dem zweiten umschaltbaren Bus-Subsystem 202 verbunden, wie aber durch die Pfeile im zweiten umschaltbaren Platten-Subsystem 202 gezeigt, ist er physikalisch oder logisch intern im zweiten umschaltbaren Platten-Subsystem 202 getrennt. Dasselbe gilt entsprechend für den zweiten Server 200 und das erste umschaltbare Platten-Subsystem 102. Die umschaltbaren Platten-Subsysteme 102 und 202 sowie deren entsprechende Schaltungen und Steuerfunktionen zum Schalten zwischen dem ersten Anschluss und dem zweiten Anschluss werden in der Hauptanmeldung beschrieben, zu welcher diese Anmeldung eine Weiterbehandlung ist.
Auf der Basis dieser Konfiguration wird im folgenden der Betrieb gemäß der vorliegenden Erfindung beschrieben. Heartbeat-Meldungen werden über die serielle Verbindung 130 zwischen den Wiederherstellungsagenten 110 und 210 gesendet. Sollte beispielsweise der erste Server 100 ausfallen, sendet sein Wiederherstellungsagent 110 keine Heartbeat- Meldung mehr und empfängt der Wiederherstellungsagent 210 die Hearbeat-Meldung nicht mehr. Gemäß der vorliegenden Erfindung verifiziert der Wiederherstellungsagent 210 dann, ob der Wiederherstellungsagent 110 tatsächlich ausgefallen ist, indem er eine Meldung über das Netzwerk N an den Wiederherstellungsagent 110 sendet. Wenn der Wiederherstellungsagent 110 nicht antwortet, bestätigt dies dem Wiederherstellungsagenten 210, dass der Wiederherstellungsagent 110 ausgefallen ist, so dass der Wiederherstellungsagent 210 eine Serie von SCSI-Resetsignalen über den Wiederherstellungs-Controller 216 und über den SCSI-Bus 218 an das erste umschaltbare Platten-Subsystem 102 sendet. Gemäß der vorliegenden Erfindung schaltet das umschaltbare Platten-Subsystem 102 bei Empfang dieser Serie von Resetsignalen intern die elektrische Verbindung seiner internen Platten von dem mit dem SCSI-Bus 114 verbundenen Anschluss zu dem mit dem SCSI-Bus 218 verbundenen Anschluss. Der Wiederherstellungscontroller 216 wird also mit den Platten im ersten umschaltbaren Platten-Subsystem 102 verbunden.
Der Wiederherstellungsagent 210 veranlasst dann den Wiederherstellungscontroller 216, die Platten im umschaltbaren Platten-Subsystem 102 logisch zu erkennen. Dann veranlasst der Wiederherstellungsagent 210 das NOS 208, die Platten in dem umschaltbaren Platten- Subsystem 102 zu "mounten" und diesen Platten Laufwerksbuchstaben für die Verwendung in folgenden Referenzen durch andere Softwarekomponenten zuzuweisen. Als nächstes prüft der Wiederherstellungsagent 210 die Integrität der Platten in dem umschaltbaren Platten-Subsystem 102, indem er etwa das Windows NT CHDSK-Programm ausführt.
Dabei sollte die Anwendung 206 über das Vorhandensein dieser neuen Laufwerke informiert werden, damit sie den Benutzern im Netzwerk N Zugriff auf die neu übernommenen Laufwerke gewähren kann. Dazu sendet der Wiederherstellungsagent 210 eine Meldung an die Anwendung 206, die angibt, dass neue Laufwerke verfügbar sind. Die Anwendung 206 kann dann auf diese neuen Laufwerke zugreifen und Daten auf den neuen Laufwerken des umschaltbaren Platten-Subsystems 102 für die Benutzer im Netzwerk N bereitstellen. Die Benutzer können also nach einer geringfügigen Verzögerung auf die Daten zugreifen, auf die sie zuvor über den ersten Server 100 zugegriffen haben.
Gemäß der vorliegenden Erfindung dient also jeder der Server 100 und 200 jeweils als Backup für den anderen Server. (In den folgenden Beschreibungen wird der jeweils andere Server 100 oder 200 als "Partner-Server" bezeichnet.) Während des normalen Betriebs dagegen bieten beide Server 100 und 200 aktiv ihre vollständige Verarbeitungsleistung für das Netzwerk N. Sollte einer der Server ausfallen, bietet der jeweils andere Server Zugriff auf die Daten in beiden umschaltbaren Platten-Subsystemen 102 und 202 für das Netzwerk N, wobei jedoch die Verarbeitungsleistung wegen der erhöhten Last des verbleibenden Servers 100 oder 200 reduziert ist.
In Fig. 2A-E ist ein Wiederherstellungsagentendienst 300 gezeigt. Der Wiederherstellungsagentendienst 300 führt die Funktionen der Wiederherstellungsagenten 110 und 210 im ersten Server 100 und im zweiten Server 200 aus und ist vorzugsweise in beiden Servern identisch. Wenn das NOS 108 oder 208 Windows NT ist, ist der Wiederherstellungsagentendienst 300 vorzugsweise als ein Windows NT-Service implementiert, der eine Reihe von "Threads" ausführt. Windows NT ist ein Multitasking/Multithreading-Betriebssystem, wobei jedoch tatsächlich jeweils nur ein "Thread" in einem Dienst ausgeführt wird. Der Wiederherstellungsagentendienst 300 kann vorzugsweise als ein Lese-Thread und ein Schreib-Thread implementiert werden, die über "Ereignisse" miteinander kommunizieren, welche Semaphoren sind, die Windows NT zwischen den Threads weitergibt. Anstatt die parallelen Spuren des Lese-Threads und des Schreib-Threads darzustellen, ist es anschaulicher, den gesamten Programmfluss zu zeigen. Der Softwarefachmann mit Erfahrung im Schreiben von Software für Multithread-Systeme weiß, wie die entsprechenden Threads zu implementieren sind.
Der Wiederherstellungsagentendienst 300 beginnt in Schritt 302, wo er bestimmt, ob eine Heartbeat-Meldung über die serielle Verbindung 150 empfangen wird. Wenn in Schritt 302 keine Heartbeat-Meldung von dem anderen Server empfangen wird, schreitet die Steuerung zu Schritt 304 fort, wo bestimmt wird, ob eine vorbestimmte Start-Zeitüberschreitung auf null gesetzt ist. Wenn ja, kehrt die Steuerung gemäß der vorliegenden Ausführungsform dann kontinuierlich zu Schritt 302 zurück. Dieser Nullwert veranlasst also, dass der Server unbegrenzt auf eine Heartbeat-Meldung wartet, und kann durch den Systemadministrator gesetzt werden, um ein Umschalten aufgrund einer Zeitüberschreitung beim Starten zu vermeiden. Die Kommunikation mit dem Partner-Server über das Netzwerk N kann jetzt wie weiter unten erläutert versucht werden, um zu sehen, ob der Partner-Server vorhanden ist und im Netzwerk N betrieben wird. Wenn nicht, gibt dies an, dass der andere Server entweder nicht gebootet wurde, nicht vorhanden ist oder ausgefallen ist.
In allen Prüfungen auf eine Heartbeat-Meldung ist eine Prüfung des Kabelfehlerstatus enthalten. Diese wird weiter unten in Verbindung mit Fig. 2E ausführlicher erläutert und sieht vor, dass ein Umschalten des mit dem Partner-Server (100 oder 200) verbundenen umschaltbaren Platten-Subsystems 102 oder 202 nicht erfolgt, wenn ein Kabelfehler vorliegt. Die Überlegung dabei ist, dass ein System zu einem bestimmten Zeitpunkt nur einen Fehler aufweist. Solange kein Kabelfehler vorliegt, wartet der Wiederherstellungsagentendienst 300 einfach auf einen zu korrigierenden Kabelfehler. Dies wird hier der einfacheren Darstellung nicht weiter erläutert.
Die Steuerung schreitet von Schritt 304 zu Schritt 306 fort, wenn die Start-Zeitüberschreitung nicht auf null gesetzt wurde. Dann wird in Schritt 306 bestimmt, ob eine Heartbeat-Meldung empfangen wird. Wen nicht, schreitet die Steuerung zu Schritt 308 fort.
Wenn in Schritt 308 eine der Start-Zeitüberschreitung entsprechende Zeit abgelaufen ist, schreitet die Steuerung zu Schritt 310 fort, wo bestimmt wird, ob eine Netzwerkpräsenzprüfung aktiviert ist. Weil der Partner-Server in Schritt 310 nicht geantwortet hat, kann es vorteilhaft sein, zu bestimmen, ob der andere Partner präsent und in Betrieb ist, indem eine Meldung über das Netzwerk N gesendet wird. Der Administrator konfiguriert das System, indem er Konfigurationsvariablen, die angeben, ob eine Netzwerkpräsenzprüfung vorgenommen werden soll, sowie eine Konfigurationsvariable setzt, welche die Adresse des Partner- Servers im Netzwerk N angibt. Entsprechend werden die verschiedenen Zeitüberschreitungen vorzugsweise als durch den Administrator änderbare Konfigurationsvariablen implementiert. Wenn die Netzwerkpräsenzprüfung nicht aktiviert ist, schreitet die Steuerung von Schritt 310 zu Schritt 330 fort, wo ein Umschalten der umschaltbaren Platten-Subsysteme 102 oder 202 des Partner-Servers zu diesem Server initiiert wird. Wenn die Netzwerkpräsenzprüfung in Schritt 310 aktiviert ist, schreitet die Steuerung zu Schritt 320 fort, wo der Wiederherstellungsagentenservice 300 versucht, wie weiter unten in Verbindung mit Fig. 2B erläutert über das Netzwerk N mit dem Partner-Server zu kommunizieren.
Wenn in den Schritten 302 und 306 eine Heartbeat-Meldung empfangen wird, gibt dies an, dass der Partner-Server in Betrieb ist. Wenn dem so ist, schreitet die Steuerung wie in Verbindung mit Fig. 2D erläutert in Schritt 340 zu der normalen Verarbeitung fort.
Das Flussdiagramm von Fig. 2B stellt die Netzwerkpräsenzprüfung des Wiederherstellungsagentendienstes 300 dar. In den Schritt 320 wird entweder von Schritt 310 in Fig. 2A oder von Schritt 348 in Fig. 2D eingetreten. In Schritt 320 versucht der Wiederherstellungsagent 300, eine Heartbeat-Meldung über das Netzwerk N zu und von dem Partner Server zu senden. Dies wird bewerkstelligt, indem eine Heartbeat-Meldung über das Netzwerk N zu dem Partner-Server gesendet wird, um zu prüfen, ob die Heartbeat-Meldung durch den Partner-Server über das Netzwerk N quittiert wird. Eine entsprechende Pause von etwa 10 Sekunden wird aufgrund der Netzwerkkommunikation einkalkuliert und hängt vom jeweiligen Netzwerk N ab. Vorzugsweise werden Meldungen, ob über die serielle Verbindung oder das Netzwerk N, durch eine Quittungsmeldung quittiert. Wenn also eine Heartbeat-Meldung über das Netzwerk N gesendet wird, sucht der Wiederherstellungsagentenservice 300 nach dem Partner-Service, um die Meldung zu quittieren. Wenn entsprechend eine Heartbeat-Meldung über das Netzwerk N empfangen wird, wird eine Quittungsmeldung zu dieser Heartbeat- Meldung an den Partner-Server gesendet. In dem Schritt 320 ist eine vorbestimmte Anzahl von Wiederholungsversuchen enthalten. Über eine Konfigurationsvariable kann der Administrator beispielsweise einstellen, dass 10 Netzwerkwiederholungen versucht werden, bevor der Partner-Server als ausgefallen bestimmt wird.
Wenn in Schritt 322 keine Netzwerk-Heartbeat-Meldung von dem Partner-Server empfangen wird, schreitet die Steuerung zu Schritt 330 in Fig. 2C fort, wo ein Umschalten initiiert wird, weil angenommen wird, dass der Partner-Server ausgefallen ist.
Wenn eine Heartbeat Meldung empfangen wurde, schreitet die Steuerung zu Schritt 324 fort, wo in der vorliegenden Ausführungsform ein SNMP-Trap an eine SNMP-Konsole gesendet wird, die den Systembetrieb verfolgt. SNMP ist eine Abkürzung für "Simple Netzwork Message Protocol" und ist ein bekannter Standard. Die SNMP-Konsole wird darüber benachrichtigt, dass eine Heartbeat-Nachricht empfangen wird, aber die serielle Verbindung 150 ausgefallen zu sein scheint. Die SNMP-Konsole kann dann den Administrator informieren oder das Ereignis in anderer Form protokollieren.
Gemäß der vorliegenden Erfindung schreitet die Steuerung dann zu Schritt 326 fort, wo der Wiederherstellungsagentendienst 300 auf einen Neustart über die serielle Verbindung 150 wartet. Wenn die Heartbeat-Meldung in Schritt 326 nicht über die serielle Verbindung 150 empfangen wird, kehrt die Steuerung zu Schritt 326 zurück. Andernfalls schreitet die Steuerung zu Schritt 340 fort, der weiter unten in Verbindung mit Fig. 2D erläutert wird, weil die serielle Verbindung 150 scheinbar wieder funktioniert.
Als weitere Ausführungsform gemäß der vorliegenden Erfindung kann in Schritt 326 eine weitere Verarbeitung ausgeführt werden. Zum Beispiel kann der Server weiterhin unter Verwendung des Netzwerks N anstelle der seriellen Verbindung 150 mit dem Partner-Server kommunizieren. Wenn diese Kommunikation über das Netzwerk N ausgefallen ist, kann in Schritt 330 ein Umschalten initiiert werden. Während weiterhin die serielle Verbindung 150 als Kommunikationsverbindung gezeigt ist, kann die gesamte Kommunikation auch über das Netzwerk N erfolgen. Dies erhöht jedoch den Netzwerkverkehr, weshalb gemäß der vorliegenden Ausführungsform vorzugsweise die serielle Verbindung verwendet wird.
In Schritt 330 ist der Teil des Wiederherstellungsagenten 300, der das Umschalten nach einem Ausfall des Partner-Servers initiiert, durch ein Flussdiagramm dargestellt. In Schritt 330 beginnend werden Laufwerke im umschaltbaren Platten-Subsystem 102 oder 202 des Partner-Servers umgeschaltet. Dies wird durch ein Verfahren bewerkstelligt, das dem in der Hauptanmeldung beschriebenen ähnlich ist und eine Reihe von Resetsignalen oder anderen Signalen an das umschaltbare Platten-Subsystem 102 oder 202 des Partner-Servers sendet. Dies veranlasst, dass das umschaltbare Platten-Subsystem 102 oder 202 umgeschaltet wird, um es mit dem Wiederherstellungscontroller 116 oder 216 dieses Servers zu verbinden, damit dieser Server die Steuerung des umschaltbaren Platten-Subsystems 102 oder 202 übe nehmen kann. Sobald dies bewerkstelligt wurde, müssen den Laufwerken in dem umschaltbaren Platten-Subsystem 102 oder 202, deren Steuerung übernommen wurde, Laufwerksbuchstaben zugewiesen werden. Durch Aufrufe an das NOS 108 und 208, die aus dem Stand der Technik wohlbekannt sind, werden den neu übernommenen Laufwerken Laufwerksbuchstaben zugewiesen. Nachdem die Laufwerke übernommen wurden, wird ihre Integrität vorzugsweise unter Verwendung einer NOS-Routine wie etwa der Windows NT CHDSK-Software verifiziert.
An dieser Stelle ist eine Erläuterung der Wiederherstellungscontroller 116 und 216 erforderlich. Vorzugsweise sollte jede Form von Zwischenspeicherung in den Wiederherstellungscontrollern 116 und 216 deaktiviert werden, da diese zwischengespeicherten Daten verloren gehen können, wenn der Partner-Server ausfällt und danach umgeschaltet wird. Wenn die registrierten Anwendungen, die auf das neu übernommene umschaltbare Platten-Subsystem 102 oder 202 zugreifen, robust genug sind, können sie diesen Datenverlust vielleicht überstehen, aber vorzugsweise sollte diese Situation vermieden werden, indem jegliches Zwischenspeichern in den Wiederherstellungscontrollern 116 und 216 deaktiviert wird.
Weiterhin verursachen viele SCSI-Controller verschiedene Fehlernachrichten beim Starten, wenn keine SCSI-Geräte verbunden sind. Beim Start sind mit den Wiederherstellungscontrollern 116 und 216 keine Laufwerke logisch oder elektrisch verbunden. Wenn sie also eine derartige Fehlererzeugungsfunktion umfassen, sollte diese Funktion entsprechend deaktiviert werden. Dies kann in der Controller-Firmware, im POST-Code (Power On Self Test) des Betriebssystems oder im NOS selbst vorgenommen werden.
Außerdem müssen die Wiederherstellungscontroller 116 und 216 natürlich in der Lage sein, neue SCSI-Laufwerke dynamisch zu übernehmen.
Nachdem die Laufwerke übernommen wurden, wissen die Anwendungen immer noch nichts über diese neu übernommenen Laufwerke. Aus diesem Grund schreitet die Steuerung zu Schritt 332 fort, wo Anwendungen 106 oder 206, die an der im Wiederherstellungsagenten 300 implementierten Anwendungsprogrammierschnittstelle (API) registriert sind, über die neuen Laufwerke informiert werden. Dies wird weiter unten ausführlicher mit Bezug auf Fig. 3 erläutert. So können die Anwendungen 106 oder 206 auf die neuen Laufwerke zugreifen und bestimmen, ob Informationen dazu vorliegen, dass ein Benützer auf die Laufwerke zugreifen muss. Das ist insbesondere bei beispielsweise ORACLE- oder anderen Datenbanken der Fall, wo der Benutzer gerade die Verbindung zu diesen Laufwerken verloren hat, aber weiterhin auf die Informationen zugreifen möchte. Die Anwendung kann dann einen entsprechenden Zugriff auf die Datenbankinformationen gewähren. Weiterhin können der erste Server 100 und der zweite Server 200 verschiedene Anwendungen 106 und 206 ausgeführt haben. Um diese Situation zu handhaben, kann jeder der Server 100 und 200 ein Shell-Programm ausführen, das der Anwendungen 106 oder 206 entspricht, die in dem Partner-Server, aber nicht auf diesem Server läuft. Das Shell-Programm kann ausschließlich die Aufgabe erfüllen, eine Instanz der Anwendung 106 oder 206 des Partner-Servers, aber nicht dieses Servers auszuführen, sobald das Shell-Programm eine Meldung von der API des Wiederherstellungsagentenservers 300 erhält, dass der Partner-Server ausgefallen ist. Dann wird die entsprechende Anwendung 106 oder 206 in diesem Server gestartet und kann den Zugriff auf die Daten des umschaltbaren Platten-Subsystems 102 oder 202 erhalten.
Von Schritt 332 schreitet die Steuerung zu Schritt 334 fort, wo bestimmt wird, ob das Umschalten erfolgreich war. Das ist der Fall, wenn das umschaltbare Platten-Subsystem 102 oder 202 richtig zu dem Server 100 oder 200 umgeschaltet wurde und Laufwerksbuchstaben zugewiesen wurden. Wenn ja, schreitet die Steuerung zu Schritt 336 fort, wo ein SNMP-Trap zu dem erfolgreichen Umschalten als SNMP-Meldung an die SNMP-Konsole wie in Verbindung mit Schritt 324 erläutert gesendet wird. Die SNMP-Konsole kann dann diese Informationen entsprechend protokollieren oder einem Administrator für weitere Diagnosezwecke bereitstellen.
Wenn das Umschalten in Schritt 334 nicht erfolgreich war, schreitet die Steuerung statt dessen zu Schritt 337 fort, wo ein ähnliches Trap, das ein nicht erfolgreiches Umschalten angibt, an die SNMP-Konsole gesendet wird.
Von den Schritten 336 und 337 schreitet die Steuerung zu Schritt 338 fort, wo ein Warten auf die Wiederherstellungskonfigurationsvariable auf wahr gesetzt wird. Dies gibt an, dass das umschaltbare Platten-Subsystem 102 oder 202 umgeschaltet wurde, und bis der Partner- Server 100 oder 200 neu gestartet wurde, fährt der vorliegende Server mit dem Betrieb unter Steuerung von beiden umschaltbaren Platten-Subsystemen 102 und 202 fort, auch wenn er heruntergefahren und neu gestartet wird. Beim Starten prüft dieser Server in einem nicht gezeigten Schritt vor dem Schritt 302, ob der Partner-Server zuvor ausgefallen ist oder nicht richtig neu gestartet wurde, damit dieser Server unmittelbar ein Umschalten durchführen kann. Dadurch wird eine unverhältnismäßig lange Wartezeit verhindert, wenn dieser Server heruntergefahren und neu gestartet wird, bevor der Partner-Server repariert wurde. Von hier schreitet die Steuerung zu Schritt 339 fort, wo der Wiederherstellungsagentendienst 300 beendet wird.
Fig. 2D zeigt ein Flussdiagramm des Wiederherstellungsagentendienstes 300 während der normalen Verarbeitung. Zu dem Schritt 340 gelangt man von Schritt 306 oder 326. In diesem Fall werden Heartbeat-Meldungen über die serielle Verbindung 150 gesendet und empfangen. Mit Schritt 340 beginnend wird eine serielle Heartbeat-Meldung vom Partner-Server empfangen, so dass die Steuerung zu Schritt 342 fortschreitet, wo bestimmt wird, ob die empfangene serielle Heartbeat-Meldung ein "Ping" bzw. eine normale Heartbeat-Meldung oder aber eine normale oder Heartbeat-Meldung zu einem sanften Herunterfahren ist. Wenn nicht, kehrt die Steuerung zu Schritt 340 zurück. Wie weiter oben bemerkt, wird immer bei Empfang einer Heartbeat-Meldung vorzugsweise durch das Senden einer Meldung an den Partner-Server quittiert, dass die Heartbeat-Meldung richtig empfangen wurde. Diese Meldung wird über die serielle Verbindung 150 oder über das Netzwerk N gesendet, wenn eine Netzwerkpräsenzprüfung durchgeführt wird.
Wenn in Schritt 342 die empfangene Heartbeat-Meldung kein "Ping", sondern eine normale Heartbeat-Meldung zu einem Herunterfahren war, gibt dies an, dass der Partner-Server normal heruntergefahren wurde. In diesem Fall ist der Partner-Server nicht ausgefallen, so dass das umschaltbare Platten-Subsystem 302 oder 202 nicht umgeschaltet werden sollte, weil es ausgeschaltet ist. Deshalb schreitet die Steuerung zu Schritt 344, wo eine Heartbeat- Quittung zu einem geplanten Herunterfahren gesendet wird, und dann zu Schritt 326 von Fig. 2B fort. Die Steuerung durchläuft in Schritt 326 dann eine Schleife, bis wieder eine Heartbeat-Meldung von dem Partner-Server empfangen wird, die angibt, dass der Partner- Server und sein umschaltbares Platten-Subsystem 102 oder 202 wieder online gebracht wurden.
Wenn in Schritt 340 keine Heartbeat-Meldung empfangen wurde, schreitet die Steuerung zu Schritt 346 fort, wo bestimmt wird, ob eine Zeitüberschreitung abgelaufen ist. Heartbeat- Meldungen müssen typischerweise innerhalb von einer vorbestimmten Zeitspanne wie etwa 30 Sekunden gesendet werden, um ein Umschalten zu vermeiden. Die vorbestimmte Zeitspanne wird typischerweise in einer Konfigurationsvariablen gespeichert. Wenn diese Zeitüberschreitung in Schritt 346 nicht abgelaufen ist, schreitet die Steuerung zu Schritt 340 fort, wo wiederum bestimmt wird, ob eine Heartbeat-Meldung empfangen wurde.
Wie typischerweise unter Verwendung von Threads implementiert, könnte dies durch das Senden einer Meldung an das NOS 108 oder 208 bewerkstelligt werden, die anfordert, dass wenn eine Heartbeat-Meldung nicht innerhalb einer bestimmten Zeitspanne über die serielle Verbindung 150 empfangen wird, die Steuerung zum Wiederherstellungsagentendienst 300 zurückkehren soll. Wiederum wurde diese auf Interrupts und Threads basierende Implementierung der Anschaulichkeit halber zu normalen Flussdiagrammen vereinfacht.
Wenn in Schritt 346 die Zeitüberschreitung abgelaufen ist, gibt dies an, dass der Partner- Server keine Heartbeat-Meldungen mehr über die serielle Verbindung 150 sendet. Deshalb schreitet die Steuerung zu Schritt 348 fort, wo bestimmt wird, ob die Netzwerkpräsenz aktiviert ist, wie weiter oben in Verbindung mit Schritt 310 erläutert wurde. Wenn die Netzwerkpräsenz aktiviert ist, schreitet die Steuerung zu Schritt 320 fort, wo eine Netzwerkpräsenzprüfung durchgeführt wird. Andernfalls schreitet die Steuerung zu Schritt 330 fort, wo ein Umschalten initiiert wird.
Schließlich zeigt Fig. 2E eine kurze Routine des Wiederherstellungsagentendienst 300, die bestimmt, ob ein Kabelfehler aufgetreten ist. In Schritt 350 wird bestimmt, ob weiterhin ein Kabelfehler angegeben ist. Zu diesem Schrift gelangt man von einem beliebigen Schritt, wenn wie in der eingeschlossenen Hauptanmeldung erläutert eine Kommunikation über die serielle Verbindung 150 versucht wird. Wenn ein Kabelfehler angegeben wird, durchläuft die Steuerung in Schritt 350 eine Schleife. Wenn kein Kabelfehler angegeben wird, schreitet die Steuerung statt dessen zu der normalen Verarbeitung von Schritt 340 fort.
Es ist also deutlich, dass die beiden Server 100 und 200, wenn sie den Wiederherstellungsagentendienst 300 als ihren Wiederherstellungsagenten 110 und 210 ausführen, miteinander kommunizieren, indem sie kontinuierlich Heartbeat-Meldungen senden. Sollte ein Server keine Heartbeat-Meldung senden, initiiert der andere Server eine Präsenzprüfung über das Netzwerk N. Wenn der Partner-Server nicht antwortet, gibt dies an, dass der Partner-Server ausgefallen ist, so dass das umschaltbare Platten-Subsystem 102 oder 202 umgeschaltet wird, damit der verbleibende Server sein eigenes umschaltbares Platten-Subsystem 102 oder 202 über seinen primären Controller 112 oder 212 sowie das andere umschaltbare Platten-Subsystem 102 oder 202 über seinen Wiederherstellungscontroller 116 oder 216 steuern kann. Auf diese Weise können die Benutzer weiterhin auf die Daten in beiden umschaltbaren Platten-Subsystemen 102 und 202 zugreifen, auch wenn einer der Server 100 oder 200 ausgefallen ist.
Fig. 3 zeigt ein Flussdiagramm des Anwendungsagenten 400. Der Anwendungsagent 400 ist eine Anwendungssoftware, die derart am Wiederherstellungsagenten 110 oder 210 registriert ist, dass sie über das Auftreten eines Umschaltens und die Verfügbarkeit von umgeschalteten Platten benachrichtigt wird. Der Anwendungsagent 400 kann dann die Ausführung von anderen Anwendungen initiieren, die auf das umschaltbare Platten-Subsystem zugreifen können - etwa von Datenbankprogrammen wie Oracle.
Mit Schritt 402 beginnend öffnet der Anwendungsagent zwei Pipes, ein RD_FAIL-Pipe und ein WR_FAIL-Pipe. Diese Pipes werden verwendet, um mit dem Wiederherstellungsagenten 110 oder 210 zu kommunizieren.
Wenn in Schritt 404 ein Fehler beim Öffnen dieser Pipes aufgetreten ist, schreitet die Steuerung zu Schritt 406 fort, wo der Anwendungsagent 400 für eine vorbestimmte Zeitdauer wartet und dann zu Schritt 402 zurückkehrt, um erneut zu versuchen, das RD_FAIL-Pipe und das WR_FAIL-Pipe zu öffnen.
Wenn diese Pipes in Schritt 404 geöffnet werden konnten, schreitet die Steuerung zu Schritt 408 fort, wo der Anwendungsagent 400 eine CREATE_PIPE-Meldung an das WR_FAIL-Pipe schreibt. Dies veranlasst den Wiederherstellungsagenten 110 oder 210 ein Fehler-Pipe zu erstellen, das mit dem Wiederherstellungsagenten 400 assoziiert ist. Vorzugsweise wird ein separates ERROR_PIPE-Pipe für jede Anwendung erstellt, die einen Anwendungsagenten 400 aufweist. Dabei können natürlich viele Anwendungen einen Anwendungsagenten 400 aufweisen, die alle auf den Wiederherstellungsagenten 110 oder 210 reagieren, wenn ein Umschalten auftritt:
Mit Schritt 410 fortschreitend liest der Anwendungsagent 400 den Namen des ERROR_PIPE-Pipes aus dem RD_FAIL-Pipe. Dieses ERROR_PIPE-Pipe sieht Meldungen vom Wiederherstellungsagentendienst 300 vor. Wenn der Wiederherstellungsagentendienst 300 einen Ausfall des Partner-Servers feststellt und das umschaltbare Platten-Subsystem 102 oder 202 umschaltet, sendet der Wiederherstellungsagentendienst 300 in Schritt 332 von Fig. 2C eine Meldung über dieses Pipe an alle registrierten Anwendungen 106 oder 206, die den Anwendungsagenten 400 implementiert haben. Die Meldung wird über das ERROR_PIPE-Pipe gesendet. Anwendungen, die den Anwendungsagenten 400 implementiert haben, werden wie in Schritt 332 definiert als registrierte Anwendungen betrachtet. Mit Schritt 412 fortschreitend wartet der Thread, in dem der Anwendungsagent 400 implementiert ist, auf eine Meldung über das ERROR_PIPE-Pipe, die wie oben erläutert in Schritt 332 gesendet wird. Wenn er eine MACHINE_FAILED-Meldung erhält, schreitet er zu Schritt 414 fort, wo der Anwendungsagent 400 die Laufwerksinformation aus dem ERROR_PIPE-Pipe liest, die in Schritt 332 durch den Wiederherstellungsagentenservice 300 bereitgestellt wird, und schreitet dann zu Schritt 416 fort, wo er verschiedenenartigen Anwendungscode implementiert. Dieser Code kann beispielsweise folgendes umfassen: Bestimmen, welche Daten auf dem umschaltbaren Platten-Subsystem 102 oder 202 verfügbar sind, das gerade durch diesen Server übernommen wurde; Verifizieren der Integrität dieser Daten; und Verfügbarmachen dieser Informationen für die verschiedenen Benutzer des Netzwerks N. Wenn der Anwendungsagent in einem Shell-Programm implementiert ist, kann er stattdessen wie weiter oben erläutert eine Instanz des entsprechenden Anwendungsprogramms öffnen, um die Funktionen zu erfüllen, die zuvor durch die Anwendung 106 oder 206 des Partner- Servers geleistet wurden. Die Steuerung schreitet dann zu Schritt 418 fort, wo alle Pipes geschlossen werden, da sie nicht mehr benötigt werden. Der Thread des Anwendungsagenten 400 wird dann in Schritt 420 beendet.
Wenn in Schritt 412 der Anwendungsagent 400 eine Meldung, dass das Umschalten nicht konfiguriert ist, in der Form einer FAILOVER_NOT_CONFIGURED-Meldung empfängt, gibt dies an, dass das Partner-Server-Umschalten aktuell nicht auf diesem bestimmten Server aktiviert ist. Diese Meldung wird nicht ausgegeben, wenn der Server zwar Partner-Server unterstützt, aber die Funktion gegenwärtig aus einem anderen Grund deaktiviert ist. Wenn diese Meldung empfangen wird, schreitet die Steuerung zu Schritt 422 fort, wo verschiedenartiger Anwendungscode implementiert werden kann oder eine Meldung an den Administrator gesendet wird.
Wenn entsprechend eine nicht erkannte Meldung von dem ERROR_PIPE-Pipe empfangen wird, schreitet die Steuerung wie von Schritt 422 zu Schritt 418 fort, wo die Pipes geschlossen werden.
Auf diese Weise wird der Anwendungsagent 400 durch den Wiederherstellungsagentenservice 300 informiert, wenn Laufwerke in dem umschaltbaren Platten-Subsystem 102 oder 202 des Partner-Servers übernommen wurden. Er kann dann die entsprechenden Schritte durchführen, um die Daten auf den neu übernommenen Laufwerksbuchstaben für die Benutzer verfügbar zu machen.
Weiterhin kann die Art und Weise, wie der Anwendungsagent 400 implementiert wird, je nach der Anwendung variieren. Zum Beispiel kann eine Instanz von ORACLE auf dem nicht ausgefallenen Server laufen. Bei einem Ausfall des Partner-Servers und dem folgenden Umschalten kann ein Anwendungsagent-Shellprogramm veranlassen, dass eine andere Instanz von ORACLE initiiert wird. Diese zweite Instanz kann dann auf die neu gemounteten Laufwerke zugreifen und kann eine Integritätsprüfung der ORACLE-Daten zu diesen Dateien durchführen, wobei bei Bedarf Korrekturen vorgenommen werden. Dann laufen also zwei Instanzen von ORACLE - eine für die ursprünglich am Server gemounteten Laufwerke, und die zweite für die neu gemounteten Laufwerke. Ein derartiger Shell-Anwendungsagent kann weiterhin verwendet werden, um Instanzen von vielen anderen Programmen zu starten, die zuvor von einem ausgefallenen Partner-Server ausgeführt wurden.
Fig. 4 zeigt verschiedene alternative Ausführungsformen. In Fig. 4 sind die Server 500, 502 und 504 als mit dem Netzwerk N verbunden gezeigt. Weiterhin sind die Server 500, 502 und 504 mit seriellen Verbindungen 506, 508 und 510 verbunden gezeigt. Wie oben erläutert, können diese seriellen Verbindungen durch verschiedenartige andere Verbindungen ersetzt werden; es können aber auch nur Heartbeat-Meldungen verwendet weiden, die ausschließlich über das Netzwerk N gesendet werden.
In Fig. 4 sind die Server 500, 502 und 504 mit dualen primären Controllern 512, 514 und 516 sowie mit dualen Wiederherstellungscontrollern 518, 520 und 522 gezeigt. Die dualen primären Controller 512, 514 und 516 sind jeweils mit dualen Speicher-Subsystemen 524, 526 und 528 verbunden. Die dualen Wiederherstellungscontroller 518, 520 und 522 sind mit den dualen Speicher-Subsystemen 524, 526 und 528 auf verschiedene Weise verbunden. Im Server 500 ist der duale Wiederherstellungscontroller 518 mit den zwei Disk-Arrays im dualen Speicher-Subsystem 528 verbunden. Im Server 502 ist der Wiederherstellungscontroller 520 mit den beiden dualen Speicher-Subsystemen 524 und 528 verbunden, die den Servern 500 und 504 entsprechen. Dies kann beispielsweise unter Verwendung von umschaltbaren Anschlüssen im dualen Wiederherstellungscontroller 520 implementiert werden.
Der Server 504 ist mit einem zweiten Wiederherstellungscontroller 530, der mit dem dualen Speicher-Subsystem 524 verbunden ist sowie mit dem Wiederherstellungscontroller 522 gezeigt, der mit dem dualen Speicher-Subsystem 526 verbunden ist.
Der Sinn des ganzen ist, dass mehrere Server auf verschiedene Weise miteinander verbunden werden können, um ein Backup für die Funktionen der anderen Server vorzusehen, indem sie die Kontrolle über das Speichersystem der anderen Server übernehmen können. Wenn in den verschiedenen in Fig. 4 dargestellten Konfigurationen einer der Server 500, 502 oder 504 ausfallen sollte, kann es erforderlich sein, dass eine Priorität zu einem der verbleibenden Server zugewiesen werden muss, damit dieser die Kontrolle über das Speichersystem des ausgefallenen Servers übernimmt. Alternativ dazu kann das Speichersystem 502 als Backup für den Server 500, der Server 504 als Backup für den Server 502 und der Server 500 als Backup für den Server 504 in einer Daisy-Chain-Konfiguration dienen. Dem Fachmann sollte deutlich sein, dass viele verschiedene Konfigurationen implementiert werden können, um aktive Server vorzusehen, die gleichzeitig als Backup für andere Server dienen können.
Es ist deutlich, dass ein System gemäß der vorliegenden Erfindung nicht auf die für die vorliegende Ausführungsform beschriebenen Details beschränkt ist. Zum Beispiel sind die umschaltbaren Platten-Subsysteme 102 und 202 als bestimmte Disk-Array-Systeme gezeigt, wobei sie jedoch ebensogut optische Platten, Bandlaufwerke oder andere Massenspeichermedien sein können. Entsprechend können die Details der Verbindungen zwischen dem ersten Server 100 und dem zweiten Server 200 stark variieren, wobei beispielsweise auch ein einziger SCSI-Bus für die Verbindung aller Komponenten oder eine Faseroptikverbindung verwendet werde können. Entsprechend initiieren die verschiedenen Server der vorliegenden Ausführungsform ein Umschalten zum Speichersystem eines anderen Servers über eine SCSI-Busverbindung, wobei jedoch auch verschiedene andere Möglichkeiten wie etwa eine serielle Verbindung oder eine Netzwerkverbindung direkt zu dem umzuschaltenden Speichersystem verwendet werden können. Dies sollte dem Fachmann deutlich sein.
Weiterhin sollte deutlich sein, dass mehr als zwei Server auf diese Weise konfiguriert werden können. Eine Vielzahl von Servern kann jeweils Zugriff auf die anderen Speicher-Subsysteme haben, wobei jeder der Server die Kontrolle übernehmen kann, wenn einer der anderen Server ausfällt.
Die vorstehende Beschreibung der vorliegenden Erfindung ist beispielhaft, wobei verschiedene Änderungen in Größe, Form, Material, Komponenten, Schaltelementen, Verbindungen und Kontakten sowie in den Details der dargestellten Schaltungen, des Aufbaus und der Betriebsverfahrens vorgesehen werden können, ohne dass dadurch der Erfindungsumfang verlassen wird.

Claims

1. Duales, fehlertolerantes aktives Serversystem für ein Netzwerk (N), wobei das System umfasst:

einen ersten aktiven Server (100) zur Verbindung mit dem Netzwerk, wobei der erste aktive Server eine erste Anzeige dahingehend, dass er ordnungsgemäß funktioniert, ergehen lässt;

einen zweiten aktiven Server (200) zur Verbindung mit dem Netzwerk, wobei der zweite aktive Server die erste Anzeige von dem ersten aktiven Server (100) empfängt und der zweite Server eine zweite Anzeige an den ersten Server dahingehend, dass er ordnungsgemäß funktioniert, ergehen lässt, und wobei der erste aktive Server (100) einen ersten Umschaltbefehl ergehen lässt, wenn der zweite aktive Server (200) die zweite Anzeige dahingehend, dass der zweite aktive Server ordnungsgemäß funktioniert, nicht ergehen lässt, und wobei der zweite aktive Server (200) einen zweiten Umschaltbefehl ergehen lässt, wenn der erste aktive Server die erste Anzeige dahingehend, dass der erste aktive Server ordnungsgemäß funktioniert, nicht ergehen lässt;

ein erstes Speichersystem (102) mit ersten Speichermedien, wobei das erste Speichersystem vorrangig die ersten Speichermedien mit dem ersten aktiven Server (100) verbindet und als Alternative dazu die ersten Speichermedien mit dem zweiten aktiven Server (200) verbindet und die ersten Speichermedien beim Empfang des zweiten Umschaltbefehls von dem zweiten aktiven Server von dem ersten aktiven Server trennt; und

ein zweites Speichersystem (202) mit zweiten Speichermedien, wobei das zweite Speichersystem vorrangig die zweiten Speichermedien mit dem zweiten aktiven Server (200) verbindet und als Alternative dazu die zweiten Speichermedien mit dem ersten aktiven Server (100) verbindet und die zweiten Speichermedien beim Empfang des ersten Umschaltbefehls von dem ersten aktiven Server von dem zweiten aktiven Server trennt.

2. System nach Anspruch 1, das des Weiteren umfasst:

einen ersten SCSI-Bus (118), der den ersten aktiven Server (100) mit dem zweiten Speichersystem verbindet, und wobei der erste Umschaltbefehl eine Reihe von SCSI-Reset-Signalen über den ersten SCSI-Bus von dem ersten aktiven Server umfasst; und

einen zweiten SCSI-Bus (218), der den zweiten aktiven Server (200) mit dem ersten Speichersystem verbindet, und wobei der zweite Umschaltbefehl eine Reihe von SCSI-Reset-Signalen über den zweiten SCSI-Bus von dem zweiten aktiven Server umfasst.

3. System nach Anspruch 1 oder 2, das des Weiteren umfasst:

eine serielle Verbindung (150) zwischen dem ersten aktiven Server (100) und dem zweiten aktiven Server (200), wobei die serielle Verbindung die erste und die zweite Anzeige leitet.

4. System nach Anspruch 1, wobei die erste und die zweite Anzeige dem Netzwerk zugeführt und von ihm empfangen werden.

5. System nach Anspruch 1, wobei der erste aktive Server (100) des Weiteren enthält:

einen Wiederherstellungsagentendienst (110), der eine Heartbeat-Meldung als die erste Anzeige an den zweiten aktiven Server (200) sendet und eine Heartbeat- Meldung als die zweite Anzeige von dem zweiten aktiven Server empfängt.

6. System nach Anspruch 5, wobei die Heartbeat-Meldungen eine PING-Heartbeat- Meldung und eine Normalabschalt-Heartbeat-Meldung enthalten.

7. System nach Anspruch 1, wobei der erste aktive Server (100) und der zweite aktive Server (200) registrierte Anwendungen ausführen, wobei, wenn der zweite aktive Server die Anzeige dahingehend, dass der zweite aktive Server ordnungsgemäß funktioniert, nicht ergehen lässt, der erste aktive Server eine vorgegebene Meldung an die registrierten Anwendungen in dem ersten aktiven Server sendet, und wobei, wenn der erste aktive Server die Anzeige dahingehend, dass der erste aktive Server ordnungsgemäß funktioniert, nicht ergehen lässt, der zweite aktive Server die vorgegebene Meldung an die registrierten Anwendungen in dem zweiten aktiven Server sendet.

8. System nach Anspruch 1, wobei der erste aktive Server (100) Software enthält, die die Integrität der Daten der zweiten Speichermedien (202) prüft, nachdem der erste Umschaltbefehl für das zweite Speichersystem ergangen ist.

9. Aktiver Server (100) zum Einsatz mit einem aktiven Partnerserver (200) in einem Netzwerk, wobei der aktive Server umfasst:

eine Verbindung (114) für ein erstes Speichersystem (102);

einen Wiederherstellungsagenten (110), der an den aktiven Partnerserver Heartbeat-Meldungen ergehen lässt und diese von ihm empfängt wobei der Wiederherstellungsagent einen Umschaltbefehl sendet, wenn er die Heartbeat-Meldung von dem aktiven Partnerserver nicht empfängt; und

eine Verbindung (118) für ein zweites Speichersystem (202), wobei das zweite Speichersystem beim Empfang des Umschaltbefehls durch das zweite Speichersystem Daten an den aktiven Server ergehen lässt.

10. Aktiver Server nach Anspruch 9, der des Weiteren umfasst:

registrierte Anwendungen, wobei der Wiederherstellungsagent (110) eine vorgegebene Meldung an die registrierten Anwendungen sendet, wenn der aktive Partnerserver (200) die Heartbeat-Meldung nicht sendet.

11. Mehrfach-Serversystem mit aktivem Backup für ein Netzwerk, wobei das System umfasst:

einen ersten aktiven Server (500);

einen zweiten aktiven Server (502);

einen dritten aktiven Server (504), wobei die aktiven Server einander Heartbeat- Meldungen zusenden und voneinander empfangen, und wobei, wenn der erste aktive Server seine Heartbeat-Meldung nicht sendet, der zweite aktive Server einen zweiten Umschaltbefehl ergehen lässt, wenn der zweite aktive Server seine Heartbeat-Meldung nicht sendet, der dritte aktive Server einen dritten Umschaltbefehl ergehen lässt, und wenn der dritte aktive Server seine Heartbeat-Meldung nicht sendet, der erste aktive Server einen ersten Umschaltbefehl ergehen lässt;

ein erstes Speichersystem (524), das vorrangig mit dem ersten aktiven Server verbunden ist und als Alternative dazu mit dem zweiten aktiven Server verbunden ist und beim Empfang des zweiten Umschaltbefehls von dem ersten aktiven Server getrennt wird;

ein zweites Speichersystem (526), das vorrangig mit dem zweiten aktiven Server verbunden ist und als Alternative dazu mit dem dritten aktiven Server verbunden ist und beim Empfang des dritten Umschaltbefehls von dem zweiten aktiven Server getrennt wird; und

ein drittes Speichersystem (528), das vorrangig mit dem dritten aktiven Server verbunden ist und als Alternative dazu mit dem ersten aktiven Server verbunden ist und beim Empfang des ersten Umschaltbefehls von dem dritten aktiven Server getrennt wird.

12. Verfahren zum Erzeugen von aktivem Backup zwischen einem ersten aktiven Server (100) und einem zweiten aktiven Server (200) in einem Netzwerk (N), wobei der erste aktive Server ein erstes Speichersystem (102) hat, das zu dem zweiten aktiven Server umgeschaltet werden kann, und der zweite aktive Server ein Speichersystem (202) hat, das zu dem ersten aktiven Server umgeschaltet werden kann, wobei das Verfahren die folgenden Schritte umfasst:

Senden von Daten von dem ersten Speichersystem über den ersten aktiven Server zu dem Netzwerk;

Senden von Daten von dem zweiten Speichersystem über den zweiten aktiven Server zu dem Speichersystem;

Ergehenlassen einer Anzeige von dem ersten aktiven Server an den zweiten aktiven Server dahingehend, dass der erste aktive Server ordnungsgemäß funktioniert;

Ergehenlassen einer Anzeige von dem zweiten aktiven Server an den ersten aktiven Server dahingehend, dass der zweite aktive Server ordnungsgemäß funktioniert; und

wenn der erste aktive Server die Anzeige von dem zweiten aktiven Server dahingehend, dass der zweite aktive Server ordnungsgemäß funktioniert, nicht empfängt, Umschalten des zweiten Speichersystems von dem zweiten aktiven Server zu dem ersten aktiven Server und Senden von Daten von dem zweiten Speichersystem über den ersten aktiven Server zu dem Netzwerk (N).

13. Verfahren nach Anspruch 12, wobei: wenn der zweite aktive Server (200) die Anzeige von dem ersten aktiven Server (100) dahingehend, dass der erste aktive Server ordnungsgemäß funktioniert, nicht empfängt, Umschalten des ersten Speichersystems (102) von dem ersten aktiven Server zu dem zweiten aktiven Server, und Senden von Daten von dem ersten Speichersystem über den zweiten aktiven Server zu dem Netzwerk (N).