[go: up one dir, main page]

DE102004057800A1 - Computerverbundsystem und Verfahren zur Überwachung des Betriebszustands einer Computereinheit innerhalb eines Computerverbundsystems durch einen Überwachungsmonitor - Google Patents

Computerverbundsystem und Verfahren zur Überwachung des Betriebszustands einer Computereinheit innerhalb eines Computerverbundsystems durch einen Überwachungsmonitor Download PDF

Info

Publication number
DE102004057800A1
DE102004057800A1 DE200410057800 DE102004057800A DE102004057800A1 DE 102004057800 A1 DE102004057800 A1 DE 102004057800A1 DE 200410057800 DE200410057800 DE 200410057800 DE 102004057800 A DE102004057800 A DE 102004057800A DE 102004057800 A1 DE102004057800 A1 DE 102004057800A1
Authority
DE
Germany
Prior art keywords
computer
computer unit
unit
virtual computer
monitor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE200410057800
Other languages
English (en)
Other versions
DE102004057800B4 (de
Inventor
Werner Roosz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Technology Solutions GmbH
Original Assignee
Fujitsu Technology Solutions GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Technology Solutions GmbH filed Critical Fujitsu Technology Solutions GmbH
Priority to DE200410057800 priority Critical patent/DE102004057800B4/de
Publication of DE102004057800A1 publication Critical patent/DE102004057800A1/de
Application granted granted Critical
Publication of DE102004057800B4 publication Critical patent/DE102004057800B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Überwachen des Betriebszustandes von mindestens einer Computereinheit (12) durch einen Überwachungsmonitor (2) und ist dadurch gekennzeichnet, dass die Computereinheit (12) als virtuelle Computereinheit (12) innerhalb eines Computersystems eingerichtet wird und dass eine Steuereinrichtung (14) eingerichtet wird, die die virtuelle Computereinheit (12) kontrolliert und Kenntnis über ihren Betriebszustand hat. Die Steuereinrichtung (14) wird mit dem Überwachungsmonitor (2) verbunden und sendet eine Negativmeldung über den Betriebszustand der virtuellen Computereinheit (12) an den Überwachungsmonitor (2), falls der Betriebszustand eine nicht ordnungsgemäß funktionsfähige virtuelle Computereinheit (12) anzeigt. Weiterhin betrifft die Erfindung ein Computerverbundsystem, das zur Ausführung des erfindungsgemäßen Verfahrens geeignet ist.

Description

  • Die Erfindung betrifft ein Computerverbundsystem mit mindestens zwei Computersystemen und ein Verfahren zum Überwachen des Betriebszustandes von mindestens einer Computereinheit innerhalb eines Computerverbundsystems durch einen Überwachungsmonitor.
  • Als Computerverbundsystem wird ein Verbund von zwei oder mehr vernetzten Computersystemen bezeichnet, die gemeinsam bestimmte Leistungen oder Dienste bereitstellen. Als Computersystem wird im Rahmen der Anmeldung ein physikalisch zusammenhängendes System verstanden, das seinerseits eine oder mehrere Computereinheiten umfassen kann. Eine Computereinheit ist dabei jede Einheit, die in der Lage ist, unabhängig von anderen Computereinheiten Programme, Scripte oder weitere Applikationen auszuführen und die unabhängig von anderen Computereinheiten innerhalb des Verbunds adressiert werden kann, um eine Computerdienstleistung bereitzustellen. Typischerweise weist eine Computereinheit ein Betriebssystem auf, das als Schnittstelle zwischen den Applikationen einerseits und den Hardwareressourcen, derer sich die Computereinheit bedient, andererseits wirkt.
  • Viele Anwendungen verlangen eine gesicherte Verfügbarkeit der bereitgestellten Leistung und Dienste mit geringen Ausfallszeiten und ohne Datenverlust (Hochverfügbarkeitsverbund). Um dieses zu gewährleisten, ist es unerlässlich, dass der Aus fall eines Computersystems, oder einer Computereinheit als Teil dieses Systems, schnell und eindeutig erkannt wird, um zum Beispiel die ihm übertragenen Aufgaben auf eine andere Computereinheit zu übertragen.
  • Zu diesem Zweck ist üblicherweise mindestens eines der Computersysteme als ein Überwachungssystem eingerichtet, das den Betriebszustand anderer Systeme, bzw. der von diesen Systemen umfassten Computereinheiten, kontinuierlich überwacht. Das Überwachungssystem kann so den Ausfall einer Computereinheit erkennen und gegebenenfalls Maßnahmen einleiten, um Aufgaben innerhalb des Computerverbundsystems umzuverteilen.
  • Eine aus dem Stand der Technik bekannte Methode zum Erkennen eines Ausfalls beruht darauf, dass eine überwachte Computereinheit über eine Netzwerkverbindung in regelmäßigen Zeitabständen eine Meldung über ihren Betriebszustand an das Überwachungssystem sendet. Bleibt diese Meldung länger als eine vorgegebene Zeitspanne aus, wertet das Überwachungssystem dieses als Zeichen für einen nicht ordnungsgemäßen Betriebszustand der überwachten Computereinheit. Eine weitere Methode gemäß dem Stand der Technik ist, dass die überwachte Computereinheit Meldung über ihren Betriebszustand nicht direkt an das Überwachungssystem sendet, sondern auf einem gemeinsam genutzten Speichermedium hinterlegt, von dem sie das Überwachungssystem in regelmäßigen zeitlichen Abständen abfragen kann.
  • Problematisch bei diesen Methoden ist, dass beim Ausbleiben von Meldungen nicht feststellbar ist, ob die überwachte Computereinheit ausgefallen ist oder ob der Übertragungsweg der Meldung ausgefallen, beziehungsweise zeitweise blockiert ist.
  • Das zugrunde liegende Kriterium, ob Meldungen länger als eine vorgegebene Zeitspanne ausbleiben, ist nicht eindeutig, sondern lediglich ein Plausibilitätskriterium für den Ausfall einer Computereinheit.
  • Je länger die Wartezeit gewählt wird, umso höher ist die Wahrscheinlichkeit, dass ein tatsächlicher Ausfall und nicht eine kurzzeitige Übertragungsstörung vorliegt. Mit der Länge der Wartezeit steigt auch die Reaktionszeit, mit der bei einem tatsächlichen Ausfall einer Computereinheit deren Aufgaben von einer funktionsfähigen Computereinheit übernommen werden können. Wird andererseits eine kürzere Wartezeit gewählt, sind zwar die Reaktionszeiten dementsprechend kürzer, dafür steigt die Wahrscheinlichkeit, dass eine Computereinheit als ausgefallen deklariert wird, obwohl sie voll funktionsfähig ist. Dieser Fall ist ebenfalls ungünstig, da Ressourcen ungenutzt bleiben und da jede Übernahme von Anwendungen auf eine andere Computereinheit mit der Gefahr des Datenverlustes behaftet ist, und daher möglichst nicht unnötigerweise durchgeführt werden sollte.
  • Es ist daher eine Aufgabe der vorliegenden Erfindung, ein Verfahren zum Überwachen des Betriebszustandes einer Computereinheit in einem Computerverbundsystem zu schaffen, bei dem ein Ausfall der Computereinheit eindeutig und schnell erkannt werden kann. Es ist eine weitere Aufgabe der vorliegenden Erfindung ein Computerverbundsystem anzugeben, das zur Durchführung des Verfahrens geeignet ist.
  • Diese Aufgabe wird, ein Computerverbundsystem betreffend, durch die Merkmale des Patentanspruchs 1 und, das Verfahren betreffend, durch die Merkmale des Patentanspruchs 19 gelöst.
  • Die Erfindung basiert auf der Grundidee, dass die überwachte Computereinheit als virtuelle Computereinheit ausgeführt wird. Eine virtuelle Computereinheit ist eine innerhalb eines Computersystems realisierte Computereinheit, die von einer ebenfalls im Computersystem vorgesehenen Steuereinheit kontrolliert wird. Ein Computersystem kann gegebenenfalls mehrere virtuelle Computereinheiten aufweisen. Die Steuereinheit hat dabei Kenntnis über den Betriebszustand einer jeden von ihr kontrollierten virtuellen Computereinheit. Erfindungsgemäß ist diese Steuereinheit dazu eingerichtet, Meldungen über den Betriebszustand der von ihr kontrollierten virtuellen Computereinheit oder Computereinheiten an den Überwachungsmonitor zu senden, der eines der Computersysteme des Verbunds als Überwachungssystem auszeichnet.
  • Eine Computereinheit, die uneingeschränkt und als einzige Instanz auf die Hardwareressourcen eines Computersystems zugreift, wird im Folgenden eine autonome Computereinheit genannt. Im Gegensatz dazu greift eine virtuelle Computereinheit nicht direkt und nicht alleinig auf Hardwareressourcen zu, sondern über eine Steuereinrichtung.
  • Diese Steuereinrichtung ist als zwischengeschaltete Schnittstelle einerseits in der Lage, die virtuelle Computereinheit und ihren Zugriff auf Hardwareressourcen zu kontrollieren, und hat andererseits jederzeit Kenntnis über den Betriebszustand der virtuellen Computereinheit. Neben der Bezeichnung virtuelle Computereinheit ist für eine derartige Computereinheit auch die Bezeichnung logische Computereinheit üblich. Die Steuereinheit kann beispielsweise ein Betriebssystem sein, auf dem ein Emulator betrieben wird, der an einer oder mehreren logischen Schnittstellen die Funktionalität von Computerhardware emuliert. An eine solche logische Schnittstelle ist dann ein weiteres Betriebssystem gekoppelt das die Basis einer virtuellen Computereinheit darstellt. Dabei brauchen das Betriebssystem der virtuellen Computereinheit und das der Steuereinrichtung zugrunde liegende Betriebssystem nicht vom gleichen Typ sein. Eine solche Steuereinheit ist auch als virtuelle Maschine oder virtuelle Plattform bekannt. Eine bekannte Implementierung eines Computersystems mit einer oder mehreren virtuellen Computereinheiten ist zum Beispiel das virtuelle Maschinensystem VM2000 der Firma Fujitsu Siemens Computers.
  • Erst dadurch, dass die überwachte Computereinheit als virtuelle Computereinheit ausgeführt wird, wird ermöglicht, dass Meldungen über einen nicht ordnungsgemäßen Betriebszustand, im Folgenden Negativmeldungen genannt, gesendet werden können. Ein nicht ordnungsgemäßer Betriebszustand bezeichnet dabei jeden Betriebszustand, in dem ein ordnungsgemäßes Funktionieren der Computereinheit nicht gegeben ist oder nicht garantiert werden kann. Beispiele sind ein Ausfall der Computereinheit, aber auch ein starke Überlastung, durch die die Computereinheit nicht mehr in der Lage ist, die ihr übertragenen Aufgaben innerhalb einer angemessenen Zeit zu bearbeiten.
  • Nach dem Stand der Technik werden nur Meldungen, die einen ordnungsgemäßen Betriebszustand einer überwachten Computereinheit betreffen, im Folgenden Positivmeldungen genannt, gesendet. Das Eintreffen einer Negativmeldung ist aber im Gegensatz zum Nichteintreffen einer Positivmeldung ein eindeu tiges Zeichen für den Ausfall einer Computereinheit, auf das entsprechend schnell reagiert werden kann.
  • Bevorzugt ist die Steuereinheit so eingerichtet, dass nur Negativmeldungen über den Betriebszustand der überwachten virtuellen Computereinheit an den Überwachungsmonitor gesendet werden.
  • Weitere vorteilhafte Ausgestaltungen und Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
  • Im Folgenden wird die Erfindung anhand von zwei Ausführungsbeispielen mithilfe von zwei Figuren näher erläutert.
  • Es zeigt
  • 1 eine schematische Darstellung eines Ausführungsbeispiels eines erfindungsgemäßen Computerverbundsystems, und
  • 2 eine schematische Darstellung eines weiteren Ausführungsbeispiels eines erfindungsgemäßen Computerverbundsystems.
  • In 1 ist auf der linken Seite der Abbildung ein Computersystem 1 dargestellt, das als Überwachungssystem eingerichtet ist und einen Überwachungsmonitor 2 sowie eine Überwachungseinrichtung 6 aufweist. Auf der rechten Seite der Figur ist ein anderes Computersystem 11 abgebildet, das eine virtuelle überwachte Computereinheit 12 sowie eine weitere virtuelle Computereinheit 13 aufweist, die beide durch eine Steuereinheit 14 kontrolliert werden. Die weitere virtuelle Computereinheit 13 verfügt über eine Ausgabeeinheit 15 mit einem Filter 16. Die Ausgabeeinheit 15 ist über ein Netzwerk 3 mit dem Überwachungsmonitor 2 verbunden. Ein weiteres Netzwerk 4 verbindet die virtuelle überwachte Computereinheit 12 mit dem Computersystem 1. Darüber hinaus ist ein gemeinsam genutztes Peripheriegerät 5 vorgesehen, das sowohl mit der virtuellen überwachten Computereinheit 12 als auch mit dem Computersystem 1 verbunden ist.
  • In dem in 1 gezeigten Ausführungsbeispiel wird das Computerverbundsystem aus den beiden Computersystemen 1 und 11 gebildet. Das Computersystem 1 fungiert dabei als Überwachungssystem und ist durch den Überwachungsmonitor 2 ausgezeichnet. Überwacht wird von dem Überwachungsmonitor 2 die virtuelle Computereinheit 12, die ein Teil des Computersystems 11 ist. Selbstverständlich sind die Erfindung und die in diesem Ausführungsbeispiel gezeigten erfindungswesentlichen Ideen auf größere Computerverbundsysteme, in denen mehr als die gezeigten zwei Computersysteme 1 und 11 miteinander verbunden sind, übertragbar. Dabei kann, beispielsweise zum Erzielen einer höheren Betriebssicherheit, mehr als ein System als Überwachungssystem eingerichtet und mit dem Überwachungsmonitor 2 ausgestattet sein. Die Anzahl überwachter Computereinheiten ist prinzipiell beliebig.
  • Im gezeigten Ausführungsbeispiel weist die Steuereinrichtung 14 des Computersystems 11 zwei logische Schnittstellen auf, mit denen sie mit den beiden virtuellen Computereinheiten 12 und 13 verbunden ist. Die virtuelle Computereinheit 12 ist dabei eine Computereinheit, die dazu eingerichtet ist Applikationen und Dienstleitung bereitzustellen. Um die Verfügbarkeit dieser Funktion zu gewährleisten wird der Betriebszustand dieser virtuellen Computereinheit 12 überwacht. Die weitere virtuelle Computereinheit 13 ist dagegen nicht zum Erbringen von Dienstleistungen eingerichtet, sondern dient der Administration der Steuereinrichtung 14. Zu diesem Zweck weist die weitere virtuelle Computereinheit 13 unter anderem die Ausgabeeinheit 15 auf, die von der Steuereinrichtung 14 Meldungen über den Betriebszustand der virtuellen Computereinheit 12 erhält. Ebenso ist ein Fall denkbar, bei dem die weitere virtuelle Computereinheit 13 neben ihrer Funktion der Administration der Steuereinrichtung 14 ebenfalls dazu eingerichtet ist, Dienstleistungen im Computerverbundsystem anzubieten. Auch ist die Anzahl der von der Steuereinrichtung 14 bereitgestellten virtuellen Computereinheiten nicht auf zwei wie in diesem Beispiel beschränkt.
  • Erfindungsgemäß überwacht der Überwachungsmonitor 2 des Computersystems 1 die virtuelle Computereinheit 12, in dem die Steuereinheit 14 Informationen über den Betriebszustand der virtuellen Computereinheit 12 an den Überwachungsmonitor 2 schickt. Im gezeigten Ausführungsbeispiel ist die Steuereinheit 14 nicht direkt mit dem Überwachungsmonitor 2 verbunden, sondern indirekt über die Ausgabeeinheit 15. Zum Weiterleiten der Informationen der Steuereinheit 14 ist die Ausgabeeinheit 15 der weiteren virtuellen Computereinheit 13 über das Netzwerk 3 mit dem Überwachungsmonitor 2 und somit dem Computersystem 1 verbunden. Diese Konstellation bietet sich an, da die Ausgabeeinheit 15 als Teil des administrativen Systems zur Steuereinheit 14 bereits zum Empfang von Statusmeldungen der Steuereinheit 14 über alle von ihr kontrollierten virtuellen Computereinheiten, also auch der virtuellen Computereinheit 12, eingerichtet ist.
  • Insbesondere sind solche Meldungen von Bedeutung, die ein nicht ordnungsgemäßes Funktionieren der virtuellen Computereinheit 12 betreffen. Um den Verkehr auf dem Netzwerk 3 möglichst gering zu halten, ist es günstig, auf die Übertragung irrelevanter Informationen für die Überwachungsfunktion zu verzichten. Zu diesem Zweck ist der Filter 16 vorgesehen, der aus allen Informationen, die die Steuereinheit 14 an die Ausgabeeinheit 15 sendet, nur solche Informationen, die die virtuelle Computereinheit 12 betreffen, weiterleitet. Als weitere Optimierung ist denkbar, dass der Filter 16 nur solche Informationen weiterleitet, die ein nicht ordnungsgemäßes Funktionieren der virtuellen Computereinheit 12, beziehungsweise eventuell weiterer, von der Steuereinheit 14 kontrollierter virtueller Computereinheiten, die überwacht werden, betreffen.
  • Im gezeigten Ausführungsbeispiel ist der Überwachungsmonitor 2 in Form eines Hintergrundprozesses oder so genannten Dämons dazu eingerichtet, ständig das Netzwerk 3 zu überwachen und den Eingang einer Meldung, die ein nicht ordnungsgemäßes Funktionieren der virtuellen Computereinheit 12 betrifft, zu detektieren. Für den Fall, dass die Ausgabeeinheit 15 keinen Filter 16 aufweist, kann eine analoge Funktion in dem Überwachungsmonitor 2 implementiert sein. Wenn der Überwachungsmonitor 2 feststellt, dass die virtuelle Computereinheit 12 nicht ordnungsgemäß funktioniert, also zum Beispiel überlastet ist oder in Endlosschleifen gefangen ist, leitet sie diese Information an die Überwachungseinrichtung 6 weiter.
  • Die Überwachungseinrichtung 6 ist dazu ausgelegt, auf den Ausfall beziehungsweise das nicht ordnungsgemäße Funktionieren der virtuellen Computereinheit 12 zu reagieren. Eine sol che Reaktion kann beispielsweise darin bestehen, die der virtuellen Computereinheit 12 zugeteilten Aufgaben auf andere am Computerverbundsystem beteiligte Systeme zu übertragen. Weiterhin ist die Überwachungseinrichtung 6 dazu eingerichtet, zusätzlich aus dem Stand der Technik bekannte Überwachungsmethoden zur Überwachung der virtuellen Computereinheit 12 auszuführen. Zu diesem Zweck sendet die virtuelle Computereinheit 12 in regelmäßigen Zeitabständen über das weitere Netzwerk 4 Meldungen über seinen eigenen Betriebszustand an die Überwachungseinrichtung 6. Bleiben solche Meldungen länger als eine vorgegebene Zeitspanne aus, kann auch dieses als Indiz dafür gewertet werden, dass das virtuelle Computersystem 12 nicht mehr ordnungsgemäß funktionsfähig ist. Ein weiterer, aus dem Stand der Technik bekannter Überwachungsweg ist, dass die virtuelle Computereinheit 12 in regelmäßigen Zeitabständen Meldungen über seinen Betriebszustand auf dem gemeinsam genutzten Peripheriegerät 5, das in diesem Fall eine Massenspeichereinrichtung ist, zu hinterlegen. Diese Meldungen werden in regelmäßigen Abständen von der Überwachungseinrichtung 6 abgefragt, wobei auch hier ein Ausbleiben dieser Meldung ein Indiz für ein nicht ordnungsgemäßes Funktionieren der virtuellen Computereinheit 12 ist. Zur Minimierung der Wahrscheinlichkeit, dass eine Einheit fehlerhaft als nicht ordnungsgemäß funktionierend deklariert wird, ist auch möglich, beide aus dem Stand der Technik bekanntne Wege zu kombinieren. Die virtuellen Computereinheit 12 wird in dem Fall erst dann als nicht mehr nicht ordnungsgemäß funktionierend angesehen, wenn für eine vorgegebene Zeitspanne Positivmeldungen über das weitere Netzwerk 4 ausbleiben und keine Positivmeldungen auf dem gemeinsam genutzten Peripheriegerät 5 eingehen. Dieses Kriterium kann noch verschärft werden, indem nur bei gleichzeitigm Ausbleiben der beiden Meldungsarten (über das weitere Netzwerk 4 bzw. über das Peripheriegerät 5 übertragen) die Einheit als nicht mehr nicht ordnungsgemäß funktionierend angesehen wird, wobei der Begriff „gleichzeitig" in diesem Zusammenhang das Auftreten des Ausbleibens beider Meldungsarten innerhalb eines vorbestimmten Zeitraums umfasst.
  • Da das virtuelle Computersystem 12 nur bei ordnungsgemäßem Funktionieren selber Meldung über seinen Betriebszustand über das Netzwerk 4 oder auf das Peripheriegerät 5 senden kann, kann nach dem Stand der Technik die Überwachungseinrichtung 6 nur indirekt auf ein nicht ordnungsgemäßes Funktionieren der virtuellen Computereinheit 12 schließen. Das erfindungsgemäße Übertragen einer Negativmeldung durch die Steuereinheit 14 erlaubt dagegen, dass der Überwachungsmonitor 2 direkt und unzweifelhaft Kenntnis über einen Ausfall der virtuellen Computereinheit 12 erhält. Die Überwachungsmethoden nach dem Stand der Technik und die erfindungsgemäße Überwachungsmethode sind als komplementäre Methoden anzusehen und bevorzugt zu kombinieren. Auch der Einfluss einer eventuellen Funktionsstörung des Übertragungswegs, also des Netzwerks 3 oder des weiteren Netzwerks 4, ist bei beiden Methoden komplementär. Nach dem Stand der Technik führt ein Ausfall des weiteren Netzwerks 4 beziehungsweise des gemeinsam genutzten Peripheriegerätes 5 dazu, dass eine Fehlfunktion der überwachten virtuellen Computereinheit 12 fälschlicherweise diagnostiziert wird, wohingegen bei der erfindungsgemäßen Methode eine Fehlfunktion des Netzwerks 3 dazu führt, dass eine tatsächliche Funktionsstörung der virtuellen Computereinheit 12 vom Überwachungsmonitor 2 nicht diagnostiziert wird. Auch aus diesem Aspekt heraus ist der parallele Einsatz beider Methoden bevorzugt.
  • Das Netzwerk 3 und das weitere Netzwerk 4 können zur Erhöhung der Betriebssicherheit als physikalisch unterschiedliche Netzwerke ausgeführt sein. Ebenfalls ist es aber möglich, eine gemeinsame Netzwerkstruktur, also beispielsweise ein LAN (Lokal Area Network) oder WAN (Wide Area Network) gleichzeitig sowohl als Netzwerk 3 als auch als weiteres Netzwerk 4 zu benutzen.
  • 2 zeigt ein weiteres Ausführungsbeispiel eines erfindungsgemäßen Computerverbundsystems. Analog zu dem in 1 gezeighten Ausführungsbeispiel sind zwei Computersysteme 1 und 11 miteinander verbunden, wobei das Computersystem 1 als überwachendes System ausgezeichnet ist und zu diesem Zweck den Überwachungsmonitor 2 aufweist. Das Computersystem 11 weist wiederum eine virtuelle Computereinheit 12 auf, die von einer Steuereinrichtung 14 kontrolliert wird. Zur Realisierung des erfindungsgemäßen Überwachungsverfahrens ist die Steuereinrichtung 14 mit dem Überwachungsmonitor 2 über ein Netzwerk 3 verbunden. Darüber hinaus verbindet ein weiteres Netzwerk 4 die virtuelle Computereinheit 12 mit dem Computersystem 1. Ebenso ist ein gemeinsam genutztes Peripheriegerät vorgesehen, das sowohl mit der virtuellen Computereinheit 12 als auch mit dem Computersystem 1 verbunden ist.
  • Im Unterschied zu dem im Zusammenhang mit 1 beschriebenen Ausführungsbeispiel weist in diesem Fall das Computersystem 11 nur eine virtuelle Computereinheit 12 auf. Diese wird wiederum von der Steuereinrichtung 14 kontrolliert. Die Ausgabeeinheit 15 und der Filter 16 sind in diesem Fall innerhalb der Steuereinrichtung 14 implementiert.
  • Die Steuereinrichtung 14, mit der dieses Ausführungsbeispiel realisierbar ist, kann beispielsweise ein Solaris Betriebssystem sein, auf dem ein X2000 Emulator ausgeführt wird. Der X2000 Emulator ermöglicht, ein Betriebssystem des Typs BS2000 als Grundlage für die virtuelle Computereinheit 15 zu betreiben. Der X2000 Emulator sieht als Ausgabeeinheit 15 eine Protokolldatei vor in die sämtliche Statusmeldungen des virtuellen Computersystems 12 geschrieben werden.
  • Die Steuereinrichtung 14 ist so ausgelegt, dass sie die Meldungen des Betriebszustandes der virtuellen Computereinheit 12, die an der Ausgabeeinheit 15, also beispielsweise der genannten Protokolldatei anliegen, zum Überwachungsmonitor 2 des Computersystems 1 weiterleitet. Zu diesem Zweck ist das Netzwerk 3 vorgesehen, das wie im zuvor beschriebenen Fall entweder ein physikalisch separates Netzwerk ist, oder zusammen mit dem weiteren Netzwerk 4 auf einer gemeinsamen Netzwerkstruktur aufbaut. In der Steuereinrichtung 14 ist wiederum der Filter 16 vorgesehen, der nur solche Meldungen, die eine nicht ordnungsgemäß funktionierende virtuelle Computereinheit 12 betreffen, zur Weiterleitung auswählt.
  • Im Unterschied zum zuvor beschriebenen Ausführungsbeispiel dient hier der Überwachungsmonitor 2 nicht nur der Detektion einer Fehlfunktion der virtuellen Computereinheit 12 nach dem erfindungsgemäßen Verfahren, sondern übernimmt gleichzeitig die Überwachung nach dem Stand der Technik über das weitere Netzwerk 4 beziehungsweise das gemeinsam genutzte Peripheriegerät 5. Auch die Funktion des Reagierens auf einen eventuellen Ausfall der virtuellen Computereinheit 12, die im ersten Ausführungsbeispiel von der Überwachungseinrichtung 6 bereit gestellt wird, ist in diesem Ausführungsbeispiel in den Überwachungsmonitor 2 integriert.
  • In beiden gezeigten Ausführungsbeispielen wurde jeweils nur eine virtuelle Computereinheit 12 vom Überwachungsmonitor 2 überwacht. Die Erfindung ist selbstverständlich nicht auf einen solchen Fall beschränkt. Die Zahl überwachter Computereinheiten ist prinzipiell beliebig und nicht auf Systeme, in denen nur virtuelle Computereinheiten überwacht werden beschränkt. Der Einsatz der Erfindung ist auch gemischten Computerverbundsystemen denkbar, in denen sowohl virtuelle Computereinheiten als auch autonome Computereinheiten vorgesehen sind. In diesem Fall ist eine mögliche Auslegung, dass alle Computereinheiten mittels Überwachungsmethoden nach dem Stand der Technik, also beispielsweise über das weitere Netzwerk 4 oder gemeinsam genutzte Peripheriegeräte 5 überwacht werden, und alle im Computerverbundsystem betriebenen virtuellen Computereinheiten zusätzlich nach dem erfindungsgemäßen Verfahren überwacht werden.
  • 1
    Computersystem
    2
    Überwachungsmonitor
    3
    Netzwerk
    4
    weiteres Netzwerk
    5
    gemeinsam genutztes Peripheriegerät
    6
    Überwachungseinrichtung
    11
    anderes Computersystem
    12
    überwachte virtuelle Computereinheit
    13
    weitere Computereinheit
    14
    Steuereinrichtung
    15
    Ausgabeeinheit
    16
    Filter

Claims (24)

  1. Computerverbundsystem mit mindestens zwei Computersystemen (1, 11), wobei – eines der Computersysteme (1) einen Überwachungsmonitor (2) aufweist, – das mindestens eine andere Computersystem (11) mindestens eine virtuelle Computereinheit (12) sowie eine Steuereinrichtung (14) aufweist, die Kenntnis über den Betriebszustand der mindestens einen virtuellen Computereinheit (12) hat, – der Betriebszustand der mindestens einen virtuellen Computereinheit (12) von dem Überwachungsmonitor (2) überwacht wird, indem – der Überwachungsmonitor (2) mit der Steuereinrichtung (14) über ein Netzwerk (3) verbunden ist und – die Steuereinrichtung (12) dazu eingerichtet ist, Meldungen über den Betriebszustand der mindestens einen virtuellen Computereinheit (12) an den Überwachungsmonitor (2) zu senden.
  2. Computerverbundsystem nach Anspruch 1, dadurch gekennzeichnet, dass die Steuereinrichtung (14) so eingerichtet ist, dass nur Negativmeldungen über den Betriebszustand der überwachten virtuellen Computereinheit (12) an den Überwachungsmonitor (2) gesendet werden, wobei eine Negativmeldung eine Meldung ist, die einen nicht ordnungsgemäßen Betriebszustand betrifft.
  3. Computerverbundsystem nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass die Steuereinrichtung (14) eine Ausgabeeinheit (15) aufweist.
  4. Computerverbundsystem nach Anspruch 3, dadurch gekennzeichnet, dass die Ausgabeeinheit (15) Teil einer weiteren virtuellen Computereinheit (13) ist, den das mindestens eine andere Computersystem (11) neben der überwachten virtuellen Computereinheit (12) aufweist.
  5. Computerverbundsystem nach einem der Ansprüche 3 oder 4, dadurch gekennzeichnet, dass die Steuereinrichtung (14) dazu eingerichtet ist, Meldungen über den Betriebszustand aller von ihr kontrollierten virtuellen Computereinheiten (12) an die Ausgabeeinheit (15) zu senden.
  6. Computerverbundsystem nach einem der Ansprüche 3 bis 5, dadurch gekennzeichnet, dass die Ausgabeeinheit (15) dazu eingerichtet ist, Meldungen, die sie von der Steuereinrichtung (14) erhält, an den Überwachungsmonitor (2) zu senden.
  7. Computerverbundsystem nach Anspruch 6, dadurch gekennzeichnet, dass die Ausgabeeinheit (15) einen Filter (16) aufweist, der nur Meldungen, die eine überwachte virtuelle Computereinheit (12) betreffen, zur Weitergabe an den Überwachungsmonitor (2) auswählt.
  8. Computerverbundsystem nach Anspruch 6, dadurch gekennzeichnet, dass die Ausgabeeinheit (15) einen Filter (16) aufweist, der nur Negativmeldungen zur Weitergabe an den Überwachungsmonitor (2) auswählt, wobei eine Negativmeldung eine Meldung ist, die einen nicht ordnungsgemäßen Betriebszustand einer überwachten Computereinheit (12) betrifft.
  9. Computerverbundsystem nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass das Computersystem (1), auf dem der Überwachungsmonitor (2) vorgesehen ist, ebenfalls mindestens eine virtuelle Computereinheit aufweist und der Überwachungsmonitor (2) auf der virtuellen Computereinheit ausgeführt wird.
  10. Computerverbundsystem nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass neben dem Überwachungsmonitor (2) eine Überwachungseinrichtung (6) vorgesehen ist und der Überwachungsmonitor (2) dazu eingerichtet ist, den Eingang einer Negativmeldung an die Überwachungseinrichtung (6) zu melden.
  11. Computerverbundsystem nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass der Überwachungsmonitor (2) dazu eingerichtet ist, bei Eingang einer Negativmeldung über eine überwachte Computereinheit (12) vorgegebene Schritte auszuführen, die dazu geeignet sind, Aufgaben dieser Computereinheit (12) innerhalb des Computerverbundsystems auf eine andere Computereinheit zu übertragen.
  12. Computerverbundsystem nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, dass die überwachte virtuelle Computereinheit (12) und der Überwachungsmonitor (2) über ein weiteres Netzwerk (4) miteinander verbunden sind.
  13. Computerverbundsystem nach Anspruch 12, dadurch gekennzeichnet, dass die überwachte virtuelle Computereinheit (12) so eingerichtet ist, dass sie in regelmäßigen zeitlichen Abständen Positivmeldungen an den Überwachungsmonitor (2) sendet, wobei eine Positivmeldung eine Meldung ist, die einen ordnungsgemäßen Betriebszustand der Computereinheit (12) betrifft.
  14. Computerverbundsystem nach Anspruch 13, dadurch gekennzeichnet, dass der Überwachungsmonitor (2) so eingerichtet ist, dass er auf das Ausbleiben einer Positivmeldung so reagiert wie auf das Eintreffen einer Negativmeldung, falls die Zeitspanne des Ausbleibens einer Positivmeldung eine vorgegebene Zeitspanne überschreitet.
  15. Computerverbundsystem nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, dass die überwachte virtuelle Computereinheit (12) und der Überwachungsmonitor (2) gemeinsam ein Peripheriegerät (5) nutzen und die überwachte virtuelle Computereinheit (12) so eingerichtet ist, dass sie in regelmäßigen zeitlichen Abständen Positivmeldungen an das Peripheriegerät (15) sendet, wobei eine Positivmeldung eine Meldung ist, die einen ordnungsgemäßen Betriebszustand der Computereinheit (12) betrifft.
  16. Computerverbundsystem nach Anspruch 13, dadurch gekennzeichnet, dass der Überwachungsmonitor (2) dazu eingerichtet ist, in regelmäßigen zeitlichen Abständen das Periperiegerät (5) abzufragen, ob und wann von der überwachten virtuellen Computereinheit (12) Meldungen über deren Betriebszustand eingegangen sind.
  17. Computerverbundsystem nach Anspruch 16, dadurch gekennzeichnet, dass der Überwachungsmonitor (2) so eingerichtet ist, dass er so reagiert wie auf das Eintreffen einer Negativmeldung, falls die überwachte virtuelle Computereinheit (12) länger als eine vorgegebene Zeitspanne nicht auf das gemeinsam genutzte Periperiegerät (5) zugegriffen hat.
  18. Computerverbundsystem nach einem der Anspruch 12 oder 13 und 15 oder 16, dadurch gekennzeichnet, dass der Überwachungsmonitor (2) so eingerichtet ist, dass er so reagiert wie auf das Eintreffen einer Negativmeldung, falls die Zeitspanne des Ausbleibens einer Positivmeldung über das weitere Netzwerk (4) eine vorgegebene Zeitspanne überschreitet und gleichzeitig die überwachte virtuelle Computereinheit (12) länger als eine vorgegebene Zeitspanne nicht auf das gemeinsam genutzte Periperiegerät (5) zugegriffen hat.
  19. Verfahren zum Überwachen des Betriebszustandes von mindestens einer Computereinheit (12) durch einen Überwachungsmonitor (2), dadurch gekennzeichnet, dass – die Computereinheit (12) als virtuelle Computereinheit (12) innerhalb eines Computersystems eingerichtet wird, – eine Steuereinrichtung (14) eingerichtet wird, die die virtuelle Computereinheit (12) kontrolliert und Kenntnis über ihren Betriebszustand hat, – die Steuereinrichtung (14) mit dem Überwachungsmonitor (2) verbunden wird, – die Steuereinrichtung (14) eine Negativmeldung über den Betriebszustand der virtuellen Computereinheit (12) an den Überwachungsmonitor (2) sendet, falls der Betriebszustand eine nicht ordnungsgemäß funktionsfähige virtuelle Computereinheit (12) anzeigt.
  20. Verfahren nach Anspruch 19, bei dem die Steuereinrichtung (14) mehrerere virtuelle Computereinheiten (12) kontrolliert.
  21. Verfahren nach einem der Ansprüche 19 oder 20, bei dem die Steuereinrichtung (14) eine Ausgabeeinheit (15) aufweist und bei dem die Steuereinrichtung (14) Meldungen über den Betriebszustand aller von ihr kontrollierten virtuellen Computereinheiten (12) an die Ausgabeeinheit (15) sendet.
  22. Verfahren nach Anspruch 21, bei dem die Ausgabeeinheit (15) Meldungen, die sie von der Steuereinrichtung (14) enthält und die eine überwachte virtuelle Computereinheit (12) betreffen, an den Überwachungsmonitor (2) sendet.
  23. Verfahren nach einem der Ansprüche 19 bis 22, bei dem der Überwachungsmonitor (2) den Eingang einer Negativmeldung über den Betriebszustand einer überwachten virtuellen Computereinheit (12) an eine Überwachungseinrichtung (6) meldet, wobei die Überwachungseinrichtung (6) dazu eingerichtet ist, Aufgaben der überwachten virtuellen Computereinheit (12) innerhalb des Computerverbundsystems auf eine andere Computereinheit zu übertragen.
  24. Verfahren nach einem der Ansprüche 19 bis 22, bei dem der Überwachungsmonitor (2) bei Eingang einer Negativmeldung über den Betriebszustand einer überwachten virtuellen Computereinheit (12) vorgegebene Schritte ausführt, die dazu geeignet sind, Aufgaben der Computereinheit (12) innerhalb des Computerverbundsystems auf eine andere Computereinheit zu übertragen.
DE200410057800 2004-11-30 2004-11-30 Computerverbundsystem und Verfahren zur Überwachung des Betriebszustands einer Computereinheit innerhalb eines Computerverbundsystems durch einen Überwachungsmonitor Expired - Lifetime DE102004057800B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE200410057800 DE102004057800B4 (de) 2004-11-30 2004-11-30 Computerverbundsystem und Verfahren zur Überwachung des Betriebszustands einer Computereinheit innerhalb eines Computerverbundsystems durch einen Überwachungsmonitor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200410057800 DE102004057800B4 (de) 2004-11-30 2004-11-30 Computerverbundsystem und Verfahren zur Überwachung des Betriebszustands einer Computereinheit innerhalb eines Computerverbundsystems durch einen Überwachungsmonitor

Publications (2)

Publication Number Publication Date
DE102004057800A1 true DE102004057800A1 (de) 2006-06-01
DE102004057800B4 DE102004057800B4 (de) 2006-08-31

Family

ID=36371438

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200410057800 Expired - Lifetime DE102004057800B4 (de) 2004-11-30 2004-11-30 Computerverbundsystem und Verfahren zur Überwachung des Betriebszustands einer Computereinheit innerhalb eines Computerverbundsystems durch einen Überwachungsmonitor

Country Status (1)

Country Link
DE (1) DE102004057800B4 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2290389A (en) * 1994-06-18 1995-12-20 Int Computers Ltd Monitoring arrangement for a computer system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2290389A (en) * 1994-06-18 1995-12-20 Int Computers Ltd Monitoring arrangement for a computer system

Also Published As

Publication number Publication date
DE102004057800B4 (de) 2006-08-31

Similar Documents

Publication Publication Date Title
DE102015121078B4 (de) Fehlervarianzerkennungsverfahren eines CAN-Kommunikationssystems sowie CAN-Kommunikationssystem
DE60318468T2 (de) Verfahren zur lösung von entscheidungslosigkeiten in einem cluster-rechnersystem
DE69802535T2 (de) Aktive fehlererkennung
DE602005002713T2 (de) Informationsverarbeitungssystem mit redundanten Pfaden und Zugriffsverfahren
DE102017218395A1 (de) Verfahren zur fehlerrobusten Regelung von hochautomatisierten Fahrzeugen
DE2908316A1 (de) Multikonfigurierbares modulares verarbeitungssystem, das mit einem vorverarbeitungssystem integriert ist
EP2478685B1 (de) Steuervorrichtung, ein-/ausgabevorrichtung, verbindungsschaltevorrichtung und verfahren für ein flugzeug-steuersystem
DE102012003242A1 (de) Verfahren zum ausfallsicheren Betreiben eines Prozesssteuersystems mit redundanten Steuereinrichtungen
DE102017214068B4 (de) Verfahren, Vorrichtung und Computerprogramm zur dynamischen Ressourcenzuweisung in einem Mehrprozessor-Computersystem
EP2491492B1 (de) Automatisierungssystem und verfahren zum betrieb eines automatisierungssystems
DE102004050350B4 (de) Verfahren und Vorrichtung zur Redundanzkontrolle von elektrischen Einrichtungen
DE10312553B3 (de) Kraftfahrzeug
EP3707567B1 (de) Verfahren zum betrieb eines landwirtschaftlichen arbeitsgerätes und anordnung umfassend ein landwirtschaftliches arbeitsgerät
EP1198143A2 (de) Netzwerk-Management System
EP3800517B1 (de) Verfahren zur erstellung eines redundanten automatisierungssystems, computerprogramm und computerlesbares medium
DE102004057800B4 (de) Computerverbundsystem und Verfahren zur Überwachung des Betriebszustands einer Computereinheit innerhalb eines Computerverbundsystems durch einen Überwachungsmonitor
EP2599265B1 (de) Verfahren zum betreiben eines bussteuergeräts sowie bussteuergerät
EP1050503A1 (de) Hilfesystem für Aufzüge
EP2224340B1 (de) Verfahren und Managementsystem zum Konfigurieren eines dynamischen Informationssystems sowie Computerprogrammprodukt
DE102009027369A1 (de) Verfahren sowie System zur Ansteuerung von mindestens einem Aktuator
EP1399818B1 (de) Verfahren und vorrichtung zur kommunikation in einem fehlertoleranten verteilten computersystem
EP1820307B1 (de) Verfahren zum nachweis der verf]gbarkeit von systemkomponenten eines redundanten kommunikationssystems
DE102012212680A1 (de) Verfahren und System zur fehlertoleranten Steuerung von Stellgliedern für eine begrenzte Zeit auf der Grundlage von vorberechneten Werten
DE102022116307A1 (de) Fahrzeugnetzwerk zur Datenkommunikation zwischen Komponenten eines Fahrzeugs sowie System und Fahrzeug damit und Verfahren dafür
EP1851934B1 (de) Verfahren zur fehlererkennung eines nachrichteninterfaces in einer kommunikationseinrichtung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R084 Declaration of willingness to licence
R081 Change of applicant/patentee

Owner name: FUJITSU TECHNOLOGY SOLUTIONS INTELLECTUAL PROP, DE

Free format text: FORMER OWNER: FUJITSU SIEMENS COMPUTERS GMBH, 80807 MUENCHEN, DE

Effective date: 20111229

R082 Change of representative

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

Effective date: 20111229

Representative=s name: EPPING HERMANN FISCHER PATENTANWALTSGESELLSCHA, DE

Effective date: 20111229

R081 Change of applicant/patentee

Owner name: FUJITSU TECHNOLOGY SOLUTIONS GMBH, DE

Free format text: FORMER OWNER: FUJITSU TECHNOLOGY SOLUTIONS INTELLECTUAL PROPERTY GMBH, 80807 MUENCHEN, DE

R071 Expiry of right