DE102013010205A1 - Error detection and localization in network services - Google Patents
Error detection and localization in network services Download PDFInfo
- Publication number
- DE102013010205A1 DE102013010205A1 DE102013010205.7A DE102013010205A DE102013010205A1 DE 102013010205 A1 DE102013010205 A1 DE 102013010205A1 DE 102013010205 A DE102013010205 A DE 102013010205A DE 102013010205 A1 DE102013010205 A1 DE 102013010205A1
- Authority
- DE
- Germany
- Prior art keywords
- operating state
- period
- state variables
- services
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 17
- 230000004807 localization Effects 0.000 title claims description 6
- 238000000034 method Methods 0.000 claims abstract description 36
- 230000004044 response Effects 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims 2
- 230000000737 periodic effect Effects 0.000 claims 1
- 238000013024 troubleshooting Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 238000012544 monitoring process Methods 0.000 description 7
- 230000002123 temporal effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/091—Measuring contribution of individual network components to actual service level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
Gebräuchliche Verfahren zur Erkennung eines Fehlers und/oder zur Lokalisierung der Fehlerursache in einem aus mehreren Komponenten 2, 3, 4, 5, 6, 7, 8 bestehenden Rechnernetz und/oder einem aus mehreren Diensten 9–16 zusammen gesetzten Netzwerkdienst setzen durchweg eine ausreichend genaue Information über funktionale Abhängigkeiten voraus. Diese Informationen stehen in einem dynamischen Umfeld häufig nicht zur Verfügung oder werden schnell unerkannt obsolet. Um eine Fehlersuche auch ohne diese Informationen durchführen zu können, wird vorgeschlagen, zunächst einen ersten Zeitraums als Referenzzeitraums festzulegen und an ausgewählten Zeitpunkten des Referenzzeitraums Daten zu einer ersten Anzahl von ausgewählten Betriebszustandsgrößen der Komponenten und/oder Dienste zu erfassen und zu speichern, mit einer anschließend bestimmten Periodendauer einen Soll-Korridor für die Betriebszustandsgrößen zu berechnen, einen zweiten Zeitraum als Erkennungszeitraum mit der Länge der Periodendauer festzulegen und die Daten aus dem Erkennungszeitraum mit dem Soll-Korridor zu vergleichen, um für eine zweite Anzahl der ausgewählten Betriebszustandsgrößen auf diese Art einen Zahlenwert als Maß für die jeweilige Abweichung zuzuordnen.Common methods for identifying an error and / or for locating the cause of the error in a computer network consisting of several components 2, 3, 4, 5, 6, 7, 8 and / or a network service composed of several services 9-16 consistently set a sufficient level precise information about functional dependencies ahead. This information is often not available in a dynamic environment or quickly becomes obsolete without being recognized. In order to be able to carry out troubleshooting without this information, it is proposed to first define a first time period as the reference time period and to record and save data on a first number of selected operating state variables of the components and / or services at selected points in time of the reference time period, followed by one To calculate a target corridor for the operating state variables for a specific period, to define a second period as the detection period with the length of the period and to compare the data from the detection period with the target corridor in order to obtain a numerical value for a second number of the selected operating state variables assign as a measure of the respective deviation.
Description
Technisches Gebiet der ErfindungTechnical field of the invention
Die vorliegende Erfindung betrifft die Erkennung von Fehlern und die Lokalisierung der Fehlerursache in einem Netzwerkdienst. Insbesondere betrifft die vorliegende Erfindung ein Verfahren zur Erkennung eines Fehlers und Lokalisierung der Fehlerursache zu einem Dienst innerhalb eines Netzwerkdienstes oder zu einer Komponente in einem Rechnernetz sowie ein zur Ausführung eines solchen Verfahrens eingerichtetes Rechnernetz.The present invention relates to the detection of errors and the location of the cause of the error in a network service. In particular, the present invention relates to a method for detecting an error and locating the cause of the error to a service within a network service or to a component in a computer network and to a computer network configured to execute such a method.
In der modernen Datenverarbeitung treten zunehmend strukturell identische Vorgänge der Benutzerinteraktion und der Datenmanipulation auf. Die bekanntesten Beispiele sind sicherlich die Internetdienste und die sog. Applikationsserver. Konsequent lässt sich ein rückwärts gewandter Trend zur Zentralisierung erkennen, der jedoch nicht auf die monolithischen Systemarchitekturen aus der Ära der Großrechner zielt, sondern auf sog. verteilte Systeme und Netzwerkdienste. Dabei handelt es sich physikalisch betrachtet um Rechnernetze mit einer Anzahl häufig sehr unterschiedlich ausgestatteter Rechenanlagen, die über Kommunikationsnetze miteinander verbunden sind. Ein Teil dieser Rechenanlagen sind die dem Benutzer zur Verfügung stehende Arbeitsplatzrechner oder Konsolen. Dort werden jedoch nur wenige Teilvorgänge der Datenverarbeitung erledigt. Die wesentlichen Beiträge zu den vom Benutzer ausgelösten oder angeforderten Datenverarbeitungen wird durch die Netzwerkdienste übernommen. Mit dem Begriff ”Netzwerkdienst” wird dabei ein über mehrere physikalische Rechenanlagen verteilter und dadurch virtualisierter Dienst bezeichnet in Abgrenzung zur ursprünglichen Bedeutung des Begriffs ”Dienst”, der für einen Hintergrundprozess auf einer Rechenanlage verwendet wird.In modern data processing, increasingly structurally identical processes of user interaction and data manipulation occur. The most well-known examples are certainly the Internet services and the so-called application servers. Consistently, a reverse trend towards centralization can be discerned, which, however, does not aim at the monolithic system architectures of the era of mainframes, but at so-called distributed systems and network services. Physically, these are computer networks with a number of often very differently equipped computers, which are interconnected via communication networks. Part of these computers are the workstations or consoles available to the user. However, only a few subprocesses of the data processing are done there. The essential contributions to the user-initiated or requested data processing are taken over by the network services. The term "network service" refers to a service distributed over several physical computers and thereby virtualized in distinction from the original meaning of the term "service", which is used for a background process on a computer system.
Die typisch vielfältige Abhängigkeit der Netzwerkdienste von lokalen Diensten auf unterschiedlichen Rechenanlagen und den dazwischen liegenden Kommunikationsstrecken macht eine Fehlersuche schwierig. Besondere Schwierigkeiten bereiten Rechnernetze und Netzwerkdienste mit dynamischer funktionaler Abhängigkeit. Eine funktionale Abhängigkeit besteht zwischen zwei Komponenten oder Diensten in Bezug auf eine Benutzeranforderung, wenn deren Bearbeitung auf einer Komponente bzw. durch einen Dienst das Funktionieren der anderen Komponente bzw. des anderen Dienstes voraussetzt. In diesem Sinne setzt die Bearbeitung einer von einer Rechenanlage eines Benutzers abgesetzten Benutzeranforderung durch einen Dienst auf einer entfernten Rechenanlage das Funktionieren der Verbindungsstrecke zwischen der Rechenanlage des Benutzers und der entfernten Rechenanlage voraus. Im Fall der genannten dynamischen funktionalen Abhängigkeiten ist vor dem Absetzen der Benutzeranforderung weder die zu deren Bearbeitung vorgesehene Rechenanlage noch die zu deren Transport dienende Kommunikationsstrecke bekannt. Beides hängt von der jeweiligen Auslastung ab.The typically diverse dependence of the network services of local services on different computers and the intervening communication links makes troubleshooting difficult. Special problems are caused by computer networks and network services with dynamic functional dependency. A functional dependency exists between two components or services with respect to a user request, if their processing on one component or service requires the functioning of the other component or service. In this sense, the processing of a remote from a user's computer system user request by a service on a remote computer system requires the functioning of the link between the user's computer and the remote computer. In the case of said dynamic functional dependencies, neither the computing system provided for processing nor the communication link serving for the transport thereof is known before the user request is issued. Both depend on the respective utilization.
Insofern ist es ein wirtschaftlich bedeutendes Ziel, Wege zur Fehlererkennung, Fehlereingrenzung und Fehlerlokalisierung bereitzustellen. Im weiteren Text wird als Fehlererkennung die Bereitstellung eines Kriteriums verstanden, anhand dessen eine objektive Aussage über das Vorhandensein oder Nichtvorhandensein einer Fehlersituation ermöglicht wird. Als Fehlerlokalisierung wird ein Mittel oder ein Verfahrensablauf verstanden, der die Eingrenzung der ursächlichen oder resultierenden Beiträge zu oder aus einer Fehlersituation auf eine Teilmenge der im Rechnernetz vorhanden Komponenten oder eine Teilmenge der in dem Netzwerkdienst gebündelten Dienste erleichtern soll.In this respect, it is an economically important goal to provide ways for error detection, error isolation and error localization. In the text which follows, error detection means the provision of a criterion by means of which an objective statement about the presence or absence of an error situation is made possible. Error localization is understood to be a means or a method sequence which is intended to facilitate the limitation of the causal or resulting contributions to or from an error situation to a subset of the components present in the computer network or a subset of the services bundled in the network service.
Zugrunde liegender Stand der TechnikUnderlying state of the art
Ein gebräuchliches Verfahren zum Erkennen von Fehlern, nämlich sog. Dienstausfällen in verteilten Systemen, wie bspw. rechnergestützten Diensten, Telekommunikationsnetzen und Anwendungsprogrammen, und zum Abschätzen der durch einen Dienstausfall verursachten Kosten offenbart das amtliche Dokument
Ein weiteres gebräuchliches Verfahren zur Fehlererkennung in Netzwerkdiensten ist in dem Artikel
Technisches ProblemTechnical problem
Die in den vorangehend beschriebenen bekannten Verfahren wesentliche Trennung bei der Datenerfassung zwischen einerseits fehlerbezogenen Betriebszustandsgrößen, nämlich den sog. Dienstausfällen, und andererseits ursachenbezogenen Betriebszustandsgrößen, nämlich den sog. Ereignissen, kann unter Umständen eine nachteilige Einschränkung darstellen. Beispielsweise lässt das an erster Stelle im vorangehenden Abschnitt erwähnte bekannte Verfahren nur eine Verfolgung der Ursächlichkeit ausgehend von einem Dienstausfall hin zu einem oder mehreren protokollierten Ereignissen zu. Somit kann das Verfahren keinen Hinweis auf einen Zusammenhang zweier Fehler geben. Dies wäre allerdings in Situationen sinnvoll, in denen die Fehlerursache allein mit den Daten zu den Ereignissen nicht entdeckt werden kann. Weiterhin sieht das bekannte Verfahren einen starren Maßstab für die Bewertung der Qualität einer Antwort des Rechnernetzes auf eine Benutzeranforderung vor. Dies wird den tatsächlichen Gegebenheit jedoch häufig nicht gut gerecht. Damit die typischen und unvermeidbaren Schwankungen der erfassten Qualität während eines fehlerfreien Betriebs nicht unzutreffend als Fehler bewertet werden, muss der starre Maßstab tolerant festgelegt werden. Insbesondere im Fall einer binären Erfassung der Qualität als gut/schlecht Wert gehen dadurch nützliche Daten über das Verhalten des Rechnernetzes verloren. Schließlich weist das bekannte Verfahren eine Neigung zur Überschätzung der zeitlichen Nähe auf.The essential separation in the above-described known methods in the data acquisition between, on the one hand, error-related operating state variables, namely the so-called service failures, and on the other hand causes-related operating state variables, namely the so-called events, may under certain circumstances constitute a disadvantageous restriction. For example, the prior art method mentioned above in the previous section only allows tracking of causality from a service outage to one or more logged events. Thus, the method can give no indication of a connection between two errors. However, this would be useful in situations where the cause of the failure can not be detected with the event data alone. Furthermore, the known method provides a rigid standard for the evaluation of the quality of a response of the computer network to a user request. However, this often does not do justice to the actual situation. In order to ensure that the typical and unavoidable fluctuations in the recorded quality during incorrect operation are not incorrectly assessed as errors, the rigid benchmark must be set tolerantly. In particular, in the case of a binary detection of the quality as a good / bad value thereby useful data on the behavior of the computer network are lost. Finally, the known method has a tendency to overestimate the temporal proximity.
Wenngleich in diesem Punkt das an zweiter Stelle im vorangehenden Abschnitt erwähnte gebräuchliche Verfahren eine erste Verbesserung bietet, setzt auch dieses Verfahren eine ausreichend genaue Information über funktionale Abhängigkeiten voraus. Diese Informationen stehen in einem dynamischen Umfeld häufig nicht zur Verfügung oder werden schnell unerkannt obsolet. In der Praxis lässt sich kaum sicherstellen, dass die vorübergehende Abschaltung einer Rechenanlage oder eines Kommunikationsgeräts zu Wartungszwecken zeitnah in der Datensammlung zu den funktionalen Abhängigkeiten hinterlegt wird. Um dies zu gewährleisten, müsste das Verfahren auch die funktionalen Abhängigkeiten automatisch verfolgen und erfassen.Although in this point the common method mentioned second in the previous section offers a first improvement, this method also requires sufficiently accurate information about functional dependencies. This information is often not available in a dynamic environment or quickly becomes obsolete. In practice, it is difficult to ensure that the temporary shutdown of a computer system or of a communication device for maintenance purposes is promptly stored in the data collection for the functional dependencies. To ensure this, the method would also have to automatically track and capture the functional dependencies.
Technische LösungTechnical solution
Die Nachteile der bekannten Lösungen werden in Bezug auf ein Verfahren behoben durch den in Anspruch 1 vorgeschlagenen Ablauf. In Bezug auf eine Vorrichtung werden die Nachteile der bekannten Lösungen durch ein Rechnernetz mit den in Anspruch 8 angegebenen Eigenschaften behoben.The disadvantages of the known solutions are resolved with respect to a method by the procedure proposed in claim 1. With regard to a device, the disadvantages of the known solutions are eliminated by a computer network having the properties specified in
Vorteilhafte WirkungenAdvantageous effects
Das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung ermöglichen ohne Kenntnisse über funktionale Abhängigkeiten in einem Netzwerkdienst bzw. einem Rechnernetz eine zielgerichtete Suche nach Fehlern und Fehlerursachen. Insbesondere erlaubt das erfindungsgemäße Verfahren eine solche Suche auch in einem Umfeld mit hochdynamischer funktionaler Abhängigkeit, wie sie bspw. in Rechnernetzen und Netzwerkdiensten mit dynamischer Lastverteilung auftritt.The method according to the invention and the device according to the invention enable a targeted search for errors and error causes without knowledge of functional dependencies in a network service or a computer network. In particular, the inventive method allows such a search even in an environment with highly dynamic functional dependence, as occurs, for example, in computer networks and network services with dynamic load distribution.
Beschreibung der ZeichnungenDescription of the drawings
Eine bevorzugte Durchführungsform eines erfindungsgemäßen Verfahrens und ein zu dessen Durchführung eingerichtetes Rechnernetz wird nachfolgend mit Bezug auf die anhängenden Zeichnungen beschrieben. Darin zeigt:A preferred embodiment of a method according to the invention and a computer network configured to carry it out will be described below with reference to the appended drawings. It shows:
Bester Weg/Weg zur Ausführung der Erfindung Best way / way to carry out the invention
Gemäß
Außerhalb des Rechnernetzes
Die nachfolgende Beschreibung einer Durchführungsform nimmt zur Vereinfachung als Substrat oder Zielobjekt für ein erfindungsgemäßes Verfahren einen Netzwerkdienst an, der ausschließlich aus Nutzdiensten auf den Rechenanlagen
Der Eintrittspunkt in den Netzwerkdienst für die Anwendung R2 des Benutzers B wird durch einen zum Netzwerkdienst gehörenden ersten Lastverteilungsdienst
Jedenfalls schematisch vereinfacht betrachtet werden durch eine eingehende Benutzeranforderung ein Webserverdienst
Zusätzlich zu den Nutzdiensten
Die Auswahl der erfassten und protokollierten ausgewählten Betriebszustandsgrößen sollte zweckmäßig alle in den Nutzdiensten
Sporadisch oder selten auftretende Zustände und Ereignisse werden vorzugsweise in der aus dem Stand der Technik bekannten Art nur beim Auftreten mit einem Zeitstempel versehen und protokolliert.Sporadic or rarely occurring states and events are preferably provided with a time stamp and logged in the manner known from the prior art only when occurring.
Daneben werden in einer weiter entwickelten Durchführungsform als weitere Betriebszustandsgrößen auch Daten erfasst, die eine objektivierte Beschreibung der Benutzereinschätzung von dem Netzwerkdienst vermitteln. Diese Daten werden bevorzugt aus dem Verhalten des Rechnernetzes
Als simulierte Benutzeranforderungen können insbesondere gespeicherte reale Benutzeranforderungen oder Teile davon durch die Überwachungsdienste
In der Praxis erfolgt die Protokollierung der Betriebszustandsgrößen zweckmäßig endlos fortlaufend, wobei die jeweils ältesten Daten zur Rückgewinnung von Speicherplatz fortlaufend mit den aktuellsten überschrieben werden. Diese Maßnahme erfüllt den ersten logischen Schritt in einem erfindungsgemäßen Verfahren, sobald die Daten für die ausgewählten Betriebszustandsgrößen über einen vorgegeben Referenzzeitraum hinweg erfasst sind.In practice, the logging of the operating state variables expediently takes place endlessly continuously, with the respectively oldest data for the recovery of storage space being continuously overwritten with the most recent ones. This measure fulfills the first logical step in a method according to the invention, as soon as the data for the selected operating state variables are recorded over a predetermined reference period.
In einem nachfolgenden oder vorangehenden Schritt wird dann ein Wert für eine erwartete zeitliche Periodizität der Betriebszustandsgrößen innerhalb des Referenzzeitraums festgelegt. Dies kann im einfachsten Fall durch den Benutzer auf der Grundlage eines hypothetischen Modells erfolgen. Beispielsweise kann es eine gute Näherung sein, eine Abhängigkeit der Betriebszustandsgrößen ausschließlich von der Tageszeit zu unterstellen. Der Einfachheit halber wird hier zudem angenommen, dass die exemplarischen Zeitreihen Xi,i=1...N, Yi,i=1...N Daten aus einem gleichmäßigen Zeitraster mit genau p Werten innerhalb einer Periode enthalten und dass die Gesamtzahl N der Werte innerhalb der Zeitreihen ein positiv ganzzahliges Vielfaches davon ist, d. h. N = r·p.In a subsequent or previous step, a value for an expected temporal periodicity of the operating state variables within the reference period is then determined. In the simplest case, this can be done by the user on the basis of a hypothetical model. For example, it may be a good approximation to assume a dependency of the operating state variables exclusively on the time of day. For the sake of simplicity, it is also assumed here that the exemplary time series X.sub.i, i = 1... N , Y.sub.i , i = 1... N contain data from a uniform time grid with exactly p values within one period and that the total number N of the values within the time series is a positive integer multiple thereof, ie N = r * p.
In einer weiter entwickelten Durchführungsform wird in den bereits erfassten Daten zu den ausgewählten Betriebszustandsgrößen selbständig nach einer Periodizität gesucht. Geeignete Algorithmen dazu sind dem Fachmann aus der Praxis bekannt. Beispielsweise kann der bereits erfasste Referenzzeitraum für eine vorgegebene Periodendauer aufgeteilt werden und die Korrelation der in den dadurch erhaltenen Abschnitten erfassten Daten berechnet werden. Eine Suche nach der maximalen Korrelation führt schließlich zu einer bevorzugten Näherung für die Periodizität der Daten. Selbstverständlich können noch kompliziertere Modelle für ein zeitlich wiederkehrendes Verhalten der Betriebszustandsgrößen entwickelt und werden.In a further developed form of implementation, a periodicity is independently searched for in the already acquired data for the selected operating state variables. Suitable algorithms for this purpose are known to the person skilled in the art. For example, the already acquired reference period can be divided for a predetermined period and the correlation of the data acquired in the sections obtained thereby can be calculated. Finally, a search for the maximum correlation leads to a preferred approximation for the periodicity of the data. Of course, even more complicated models can be developed for a temporally recurring behavior of the operating state variables.
Mit der festgelegten Periodendauer wird aus den im Referenzzeitraum erfassten Daten für jede der ausgewählten Betriebszustandsgrößen ein Soll-Korridor, also eine Reihe von Intervallen
Durch einen Vergleich der Daten aus dem Erkennungszeitraum mit dem Soll-Korridor wird für jede der exemplarisch betrachteten ausgewählten Betriebszustandsgrößen X, Y ein gewichtender Zahlenwert wX, wY gewonnen, der den jeweiligen Grad der Abweichung quantitativ wiedergibt. Im exemplarischen Fall wird dazu die Anzahl der Werte in dem Erkennungszeitraum mit den p Werten Xj=s...(s+p-1); 1 ≤ s ≤ (s + p – 1) ≤ N bestimmt, die nicht in dem zuvor berechneten Intervall des Soll-Korridors liegen: By comparing the data from the detection period with the target corridor, a weighting numerical value w X , w Y is obtained for each of the selected operating state variables X, Y, which quantitatively reflects the respective degree of the deviation. In the exemplary case, the number of values in the recognition period with the p values X j = s ... (s + p-1) ; 1 ≤ s ≤ (s + p-1) ≤ N, which are not in the previously calculated interval of the target corridor:
In einer weiter entwickelten Durchführungsform kann der Zahlenwert durch die Anwendung einer streng monoton fallenden Funktion auf den zuvor berechneten Wert der Korrelation zwischen der Datenreihe des Erkennungszeitraums und dem zugehörigen Soll-Korridor ermittelt werden.In a further developed embodiment, the numerical value can be determined by applying a strictly monotonically decreasing function to the previously calculated value of the correlation between the data series of the detection period and the associated desired corridor.
Dadurch kann in einer noch weiter entwickelten Durchführungsform dem Administrator anschließend eine nach dem Zahlenwert absteigend geordnete Übersicht der ausgewählten Betriebszustandsgrößen angezeigt oder anderweitig dargestellt werden.As a result, in a still further developed implementation form, the administrator can subsequently display or otherwise display an overview of the selected operating state variables arranged in descending order of the numerical value.
In einer noch weiter entwickelten Durchführungsform wird dem Administrator ausgehend von der geordneten Übersicht die Möglichkeit eröffnet, für eine daraus ausgewählte Betriebszustandsgröße nach anderen Betriebszustandsgrößen mit einer objektiv ähnlichen Abweichung vom Soll-Korridor zu suchen. Insofern bietet sich als eine weitere zweckmäßige Ausgestaltung an, die geordnete Übersicht zu Beginn der Interaktion mit dem Administrator auf die sog. weiteren Betriebszustandsgrößen zu beschränken, die nach der vorangehenden Definition eine objektivierte Beschreibung der Benutzereinschätzung der aus dem Rechnernetz abrufbaren Dienste vermitteln. Dadurch wird die Aufmerksamkeit des Administrators im ersten Moment der Fehlersuche auf die für den Betrieb besonders relevanten Abweichungen gerichtet. Als ein geeignetes Maß für die objektive Ähnlichkeit kann beispielsweise die statische Korrelation zwischen den zu vergleichenden Zeitreihen im Beobachtungszeitraum herangezogen werden. Einzelheiten zur Berechnung der Korrelation sind in der einschlägigen Fachliteratur zu finden und werden hier deshalb nicht ausgeführt.In an even more advanced implementation form, the administrator is given the opportunity, based on the ordered overview, to search for other operating state variables with an objectively similar deviation from the target corridor for a selected operating state variable. In this respect, a further expedient refinement is to limit the ordered overview at the beginning of the interaction with the administrator to the so-called further operating state variables which, according to the preceding definition, convey an objectified description of the user assessment of the services which can be called up from the computer network. As a result, the administrator's attention is directed to the deviations particularly relevant for operation at the first moment of the troubleshooting. As a suitable measure of the objective similarity, for example, the static correlation between the time series to be compared during the observation period can be used. Details on the calculation of the correlation can be found in the relevant technical literature and are therefore not carried out here.
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- WO 02/45315 A2 [0005] WO 02/45315 A2 [0005]
Zitierte Nicht-PatentliteraturCited non-patent literature
- ”Fehler-Erkennung in Netzwerken” auf den Seiten 30 ff. in der Ausgabe 10/2011 der Zeitschrift ”Funkschau” [0006] "Error detection in networks" on pages 30 ff. In issue 10/2011 of the journal "Funkschau" [0006]
Claims (9)
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102013010205.7A DE102013010205A1 (en) | 2013-06-20 | 2013-06-20 | Error detection and localization in network services |
DE112014002944.0T DE112014002944A5 (en) | 2013-06-20 | 2014-06-16 | Error detection and localization in network services |
PCT/DE2014/000301 WO2014202039A1 (en) | 2013-06-20 | 2014-06-16 | Error detection and localization in network services |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102013010205.7A DE102013010205A1 (en) | 2013-06-20 | 2013-06-20 | Error detection and localization in network services |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102013010205A1 true DE102013010205A1 (en) | 2014-12-24 |
Family
ID=51492782
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102013010205.7A Withdrawn DE102013010205A1 (en) | 2013-06-20 | 2013-06-20 | Error detection and localization in network services |
DE112014002944.0T Withdrawn DE112014002944A5 (en) | 2013-06-20 | 2014-06-16 | Error detection and localization in network services |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE112014002944.0T Withdrawn DE112014002944A5 (en) | 2013-06-20 | 2014-06-16 | Error detection and localization in network services |
Country Status (2)
Country | Link |
---|---|
DE (2) | DE102013010205A1 (en) |
WO (1) | WO2014202039A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115718672A (en) * | 2022-11-22 | 2023-02-28 | 支付宝(杭州)信息技术有限公司 | Application anomaly detection method and device |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002045315A2 (en) | 2000-11-28 | 2002-06-06 | Micromuse Inc. | Method and system for predicting causes of network service outages using time domain correlation |
US20090201820A1 (en) * | 2007-12-31 | 2009-08-13 | Honeywell International Inc. | Method for predicting a fault in a security system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7739143B1 (en) * | 2005-03-24 | 2010-06-15 | Amazon Technologies, Inc. | Robust forecasting techniques with reduced sensitivity to anomalous data |
-
2013
- 2013-06-20 DE DE102013010205.7A patent/DE102013010205A1/en not_active Withdrawn
-
2014
- 2014-06-16 DE DE112014002944.0T patent/DE112014002944A5/en not_active Withdrawn
- 2014-06-16 WO PCT/DE2014/000301 patent/WO2014202039A1/en active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002045315A2 (en) | 2000-11-28 | 2002-06-06 | Micromuse Inc. | Method and system for predicting causes of network service outages using time domain correlation |
US20090201820A1 (en) * | 2007-12-31 | 2009-08-13 | Honeywell International Inc. | Method for predicting a fault in a security system |
Non-Patent Citations (2)
Title |
---|
"Fehler-Erkennung in Netzwerken" auf den Seiten 30 ff. in der Ausgabe 10/2011 der Zeitschrift "Funkschau" |
Hendrawan, Kurnia: Fehler-Erkennung in Netzwerken. In: Funkschau, 10/2011, 30-31. * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115718672A (en) * | 2022-11-22 | 2023-02-28 | 支付宝(杭州)信息技术有限公司 | Application anomaly detection method and device |
Also Published As
Publication number | Publication date |
---|---|
WO2014202039A1 (en) | 2014-12-24 |
DE112014002944A5 (en) | 2016-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102022201746A1 (en) | MANAGE DATA CENTERS WITH MACHINE LEARNING | |
DE60305601T2 (en) | Method for temporal fault isolation and identification | |
DE202017102381U1 (en) | Device for improving the robustness against "Adversarial Examples" | |
DE112016005290T5 (en) | ANOM-RELIEF ON TEMPORAL CAUSALITY GRAPHS | |
DE112021003747T5 (en) | DETECTING ANOMALIES IN A NETWORK TOPOLOGY | |
DE102018116696A1 (en) | A method for generating normal state prediction data of a plant and apparatus using the same | |
DE112021005651B4 (en) | Information processing device, information processing method and program | |
EP2186003A2 (en) | Method and device for determining a probability of occurrence | |
DE102019114378A1 (en) | METHOD AND SYSTEM FOR PREDICTING THE SYSTEM STATUS | |
EP3528162B1 (en) | Method for recognizing abnormal operational states | |
DE102014214300A1 (en) | Device and method for error and attack detection for a motor vehicle | |
DE102007054648B4 (en) | Error identification in a computer-based network | |
DE102022132047A1 (en) | SYSTEMS AND METHODS FOR DETECTING MANUFACTURING ANOMALIES | |
DE102017218922A1 (en) | Method and device for data collection | |
WO2020016340A1 (en) | Penetration test method, computer program and device for data processing | |
DE102018221684A1 (en) | Device and method for anomaly detection and for training a model for anomaly detection | |
DE102013010205A1 (en) | Error detection and localization in network services | |
DE10259794A1 (en) | Event management method and apparatus | |
EP1451689A2 (en) | Method and system for processing fault hypotheses | |
EP3929554A1 (en) | Improved fault detection in machines using ai | |
DE102020207449A1 (en) | Method, computer program and device for processing signals | |
DE102019106724A1 (en) | Efficient data processing | |
EP3698103A1 (en) | Estimating the measurement accuracy of different sensors for the same measurand | |
DE112021001418T5 (en) | PERFORMANCE EVENTS TROUBLESHOOTING SYSTEM | |
DE102022208921A1 (en) | SYSTEM FOR ADMINISTRATION OF A DEVICE, METHOD FOR ESTIMATION OF A CAUSE OF FAULT IN A DEVICE AND PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R118 | Application deemed withdrawn due to claim for domestic priority |