[go: up one dir, main page]

DE102006003611A1 - Method for finding a faulty record in a set of records - Google Patents

Method for finding a faulty record in a set of records Download PDF

Info

Publication number
DE102006003611A1
DE102006003611A1 DE200610003611 DE102006003611A DE102006003611A1 DE 102006003611 A1 DE102006003611 A1 DE 102006003611A1 DE 200610003611 DE200610003611 DE 200610003611 DE 102006003611 A DE102006003611 A DE 102006003611A DE 102006003611 A1 DE102006003611 A1 DE 102006003611A1
Authority
DE
Germany
Prior art keywords
data
target
records
cell
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE200610003611
Other languages
German (de)
Inventor
Einar Dr. Broese
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Corp
Original Assignee
Siemens Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Corp filed Critical Siemens Corp
Priority to DE200610003611 priority Critical patent/DE102006003611A1/en
Priority to RU2008134475/09A priority patent/RU2008134475A/en
Priority to EP07703593A priority patent/EP1977319A2/en
Priority to PCT/EP2007/050018 priority patent/WO2007085504A2/en
Priority to CNA2007800035403A priority patent/CN101375254A/en
Publication of DE102006003611A1 publication Critical patent/DE102006003611A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Complex Calculations (AREA)
  • Debugging And Monitoring (AREA)
  • General Factory Administration (AREA)

Abstract

The method involves dividing at least one value range into intervals, forming N-dimensional cells in the input data (18a) space with the intervals as edge lengths, selecting at least one cell (Z) to be checked, determining a check criterion for the target data of the data record (16) of the selected cell and characterizing as faulty any data record whose target data item value fails the check criterion.

Description

Die Erfindung betrifft ein Verfahren zum Auffinden eines fehlerhaften Datensatzes in einer Datensatzmenge.The The invention relates to a method for finding a faulty one Record in a record set.

In vielen Bereichen der modernen Technik werden Daten in großem Umfang verarbeitet. In der Regel sind hierbei die Daten in Form von Datensätzen organisiert. Jeder Datensatz umfasst hierbei eine bestimmte Anzahl von Einzeldaten. Jedes Einzeldatum kann hierbei wiederum verschiedene Werte annehmen.In Many areas of modern technology are data on a large scale processed. As a rule, the data are organized in the form of data records. Each record comprises a certain number of individual data. Each individual date can in turn assume different values.

Datensätze sind in der Regel so strukturiert, dass deren Einzeldaten in irgendeiner Art und Weise zusammenhängen bzw. zueinander korreliert sind. Z.B. in einem Kraftfahrzeug kann ein Datensatz die Ausgangs- bzw. Messwerte sämtlicher Sensoren im Kraftfahrzeug beinhalten, die zu einem bestimmten Zeitpunkt oder innerhalb eines bestimmten Zeitintervalls erfasst werden. In einer Datenverarbeitungsanlage z.B. einer Versicherung kann ein Datensatz z.B. sämtliche bekannte persönliche Daten bzw. Versicherungsdaten eines bestimmten Versicherten umfassen.Records are usually structured so that their individual data in any Way related or correlated with each other. For example, in a motor vehicle can a record the output or measured values of all sensors in the motor vehicle include, at any given time or within one certain time interval are detected. In a data processing system e.g. For insurance, a record may be e.g. all known personal Data or insurance data of a specific insured.

In modernen Automatisierungssystemen werden heute in großem Umfang Messdaten bzw. Steuerdaten aufgenommen bzw. erzeugt und für die Steuerung der Anlage verwendet. Auch hier fallen also viele Daten bzw. Datensätze an. Ohne Beschränkung der Allgemeingültigkeit wird im weiteren Verlauf des Textes die Erfindung am Beispiel der Automatisierungstechnik erläutert.In Modern automation systems are being widely used today Measurement data or control data recorded or generated and for the controller used the plant. Here too, many data or data records are generated. Without restriction of generality is in the further course of the text, the invention using the example of Automation technology explained.

Sowohl bei der Erfassung oder Erzeugung, als auch bei der Weiterleitung der Daten kann es zu Fehlern kommen. Z.B. kann ein Messdaten erzeugender Sensor ausfallen oder fehlerhafte Daten liefern. Datensätze oder Teile dieser können bei der automatischen Verarbeitung durch Programmfehler vertauscht werden. Bei der manuellen Eingabe von Kenngrößen oder Parame tern können Fehleingaben oder Tippfehler auftreten. All dies kann zu verschiedenen Problemen, von Qualitätsmängeln bis hin zum Produktionsstillstand führen.Either during acquisition or generation, as well as during forwarding the data can lead to errors. For example, can be a measuring data generating Sensor fail or provide faulty data. Records or Parts of these can reversed during program execution due to program errors become. When manually entering parameters or parameters, incorrect entries or Typing errors occur. All of this can lead to various problems, from quality defects to lead to production downtime.

Obschon während der Konzeptionierung, Planung bzw. Inbetriebsetzung einer entsprechenden Anlage heute viel Aufwand auf die Kontrolle der bearbeiteten Daten verwendet wird, passiert es immer wieder, dass fehlerhafte Daten zu spät entdeckt werden. Ein Schaden ist dann oft bereits eingetreten bzw. es dauert sehr lange, bis die Quelle der fehlerhaften Daten lokalisiert ist.Although while the conceptual design, planning or commissioning of a corresponding Plant today much effort on the control of the processed data used, it happens again and again that erroneous data too late get discovered. Damage has often already occurred or It takes a very long time to locate the source of erroneous data is.

Effektive Suchverfahren, um in einer Datensatzmenge fehlerhafte Datensätze zu identifizieren, fehlen heute. Händisch ist die stetig wachsende Menge der Datensätze nicht mehr kontrollierbar oder überprüfbar. Daher sind heute automatisierbare Verfahren zur Suche fehlerhafter Datensätze notwendig.effective Search methods to identify bad records in a record set are missing today. manually the steadily growing amount of data sets is no longer controllable or verifiable. Therefore Automated methods for searching faulty data sets are necessary today.

Bisher ist eine automatische Kontrolle von Daten bzw. Datensätzen in der Regel lediglich als Grenzwertkontrolle ausgeführt. Für jedes einzelne Datum in einem Datensatz werden Gültigkeitsbereiche, z.B. ein Intervall zwischen Minimal- und Maximalwert oder eine Menge erlaubter Werte, festgelegt. Sämtliche Werte, die außerhalb des erlaubten Gültigkeitsbereiches liegen, werden als ungültig gekennzeichnet. Z.B. ist in einem Walzwerk bekannt, dass nur Rohmaterial mit Dicken von 2cm bis 20cm gewalzt wird. Ein Datensatz, welcher eine Materialdicke von 0,2cm oder 200cm beinhaltet, ist damit sicher fehlerhaft.So far is an automatic control of data or records in usually only designed as limit value control. For each single dates in a record become scopes, e.g. one Interval between minimum and maximum value or a lot of allowed Values, set. All Values that are outside of the allowed scope lie, are considered invalid characterized. For example, is known in a rolling mill that only raw material rolled with thicknesses of 2cm to 20cm. A record, which a material thickness of 0.2cm or 200cm, it is certainly faulty.

Durch das bekannte Verfahren können also nur grobe Fehler herausgefiltert werden, da die Grenzen für erlaubte Werte von Daten soweit geöffnet werden müssen, dass alle theoretisch möglichen Werte als nicht fehlerhaft erkannt werden. Kleinere Fehler, wie sie z.B. durch das Vertauschen von Materialien entstehen, werden nicht gefunden. Legt für obiges Beispiel ein Arbeiter im Walzwerk z.B. Material der Dicke 20cm ein und erzeugt jedoch Eingangsdaten mit einem Dickenwert von 2cm kann dieser Fehler durch das obige Verfahren nicht entdeckt werden.By the known method can So only gross errors are filtered out because the limits are allowed Values of data are opened so far have to, that all theoretically possible values be recognized as not faulty. Smaller errors, such as caused by swapping materials are not found. Sets for the above Example a worker in the rolling mill e.g. Material of thickness 20cm and, however, can generate input data with a thickness of 2cm this error can not be detected by the above method.

Aufgabe der vorliegenden Erfindung ist es, ein verbessertes Verfahren zum Auffinden eines fehlerhaften Datensatzes in einer Datensatzmenge anzugeben.task The present invention is an improved method for Finding a faulty record in a set of records specify.

Die Aufgabe der Erfindung wird wie folgt gelöst. Die Erfindung beruht auf folgender Überlegung. In der Regel enthält ein Datensatz alle Daten zur vollständigen Beschreibung eines Sachverhalts oder Vorgangs. Z.B. ist in der Automatisierungstechnik davon auszugehen, dass alle Prozessparameter des in der automatisierten Anlage ablaufenden Prozesses auch erfasst werden und in einem Datensatz zusammengefasst werden. Ansonsten würde ja auch ein Gelingen des Prozesses nicht vorhersehbar sein oder stark streuende Ergebnisse liefern. Alle Daten eines Datensatzes stehen somit in irgendwie gearteten Zusammenhängen bzw. Beziehungen zueinander. Diese Bedingungen bzw. Zusammenhänge sind außerdem reproduzierbar, d.h. dass Daten eines in etwa gleichen Datensatzes lediglich um einem Restfehler schwanken. Diese Zusammenhänge sind z.B. dann gegeben, wenn neuronale Netze diese abbilden können. Die erwähnten Beziehungen bzw. Zusammenhänge müssen dabei weder explizit bekannt, noch beschreibbar, noch gezielt nachbildbar sein, sie müssen lediglich existieren.The The object of the invention is achieved as follows. The invention is based on following consideration. In the rule contains a record all data for a complete description of a fact or process. For example, is to be assumed in automation technology that all process parameters of the running in the automated system Process also be captured and summarized in a record become. Otherwise would yes, even a success of the process can not be foreseen or provide highly scattering results. All data of a data record are thus in some kind of relationships or relationships. These conditions or relationships are as well reproducible, i. that data of a roughly same record only fluctuate around a residual error. These relationships are e.g. then given when neural networks can map them. The mentioned Relationships or relationships have to neither explicitly known nor describable, nor specifically reproducible be, they have to only exist.

Die Erfindung beruht weiterhin auf der Idee, die Daten eines Datensatzes in sogenannte Eingangsdaten und Zieldaten aufzuteilen. Die oben erwähnten Zusammenhänge gelten dann derart, dass sich bei gleichen oder ähnlichen Eingangsdaten ähnliche Zieldaten ergeben, lediglich leicht streuend um einen für die jeweilige Kombination aus Eingangsdaten und Zieldaten typischen Restfehler. Ein neuronales Netz wäre dann z.B. in der Lage, aus den Eingangsdaten als Eingänge die Zieldaten, behaftet mit dem entsprechenden Restfehler, an seinem Ausgang zu reproduzieren. Datensätze, für die die Zieldaten stärker als durch den Restfehler bedingt von dieser Regel abweichen, werden als fehlerhafte bzw. potentiell fehlerhafte Daten klassifiziert.The invention is further based on the idea to divide the data of a data set into so-called input data and target data. The above-mentioned relationships then apply such that the same or similar input data results in similar target data, only slightly scattering around a residual error typical of the respective combination of input data and target data. For example, a neural network would be able to reproduce from the input data as inputs the target data, associated with the corresponding residual error, at its output. Data sets for which the target data deviates from this rule more than due to the residual error are classified as erroneous or potentially erroneous data.

Mit anderen Worten beruht also die Grundidee der Erfindung darauf, fehlerhafte Datensätze dadurch zu erkennen, dass fehlerhafte Zieldaten bei gegebenen bzw. ähnlichen Eingangsdaten zu anderen als fehlerfrei angenommenen Zieldaten bzw. zu den aus den Eingangs- und Zieldaten ableitbaren Zusammenhängen im Widerspruch stehen.With In other words, the basic idea of the invention is based on faulty records recognize that erroneous target data given or similar Input data for other than faultless assumed target data or to the contexts derived from the input and destination data in the Contradiction.

Dem erfindungsgemäßen Verfahren liegen eine Anzahl von M Datensätzen zu Grunde, die jeweils eine Anzahl von N Eingangsdaten und mindestens ein mit diesen korreliertes Zieldatum umfassen. Die Unterscheidung in Eingangsdaten und Zieldatum kann z.B. durch die Art der Daten an sich erfolgen. Da bei einer Automatisierungsanlage beispielsweise in der Regel alle prozessrelevanten Daten erfasst werden, um gleiche Produkte bzw. konstante Produktqualität am Prozessausgang zu garantieren, können dort z.B. die prozesstechnischen Messdaten als Eingangsdaten und ein Messwert am produzierten Gut bzw. Prozessprodukt als Zieldatum gewählt werden. Alternativ kann die Einteilung aber auch willkürlich erfolgen, d.h. ein zu kontrollierendes Datum des Datensatzes als Zieldatum und die restlichen als Eingangsdaten gewählt werden.the inventive method are a number of M records each having a number of N input data and at least include a correlated target date. The distinction in input data and target date, e.g. by the nature of the data in itself. As in an automation system, for example, in As a rule, all process-relevant data is recorded in the same way Products or constant product quality can be guaranteed at the process output e.g. the metrological data as input data and a Measured value on the produced good or process product can be selected as the target date. Alternatively, the classification can also be arbitrary, i. one too controlling date of the record as the target date and the remaining selected as input data become.

Die N Eingangsdaten zusammen mit dem Zieldatum der Datensätze können auch nur eine Untermenge von größeren Gesamtdatensätzen sein. Mit anderen Worten werden dann aus jedem Gesamtdatensatz zunächst nicht zu betrachtende Daten ausgeblendet und das erfindungsgemäße Verfahren wird dann nur auf der entsprechenden Untermenge der Daten der Gesamtdatensätze ausgeführt. Dies führt zu Rechenzeitvorteilen. Sicherzustellen bleibt lediglich, dass die Zieldaten möglichst genau durch die Eingangsdaten definiert sind.The N input data along with the target date of the records can also just a subset of larger total records. With In other words, then from each total data set not at first hidden data to be considered and the inventive method is then executed only on the appropriate subset of the data records of the total records. This leads to computing time advantages. It is only necessary to ensure that the target data is as possible exactly defined by the input data.

Jedes Eingangsdatum kann nun verschiedene Werte annehmen, die aber in ihrem jeweiligen Wertebereich begrenzt sind. So kann ein mit 24V betriebener Messfühler z.B. nur Spannungen von 0V bis 24V abgeben. Da jedes Eingangsdatum somit auf einem Zahlenstrahl innerhalb des begrenzten Wertebereiches liegt, wird durch die Zusammenfassung sämtlicher N Eingangsdaten zu einem Datensatz – nach Art eines Vektors – ein N-dimensionaler Hyperquader bzw. Eingangsdatenraum aufgespannt. Der Eingangsdatenraum ist also endlich bzw. begrenzt. Alle denkbaren Wertekombinationen von Eingangsdaten liegen somit innerhalb des Hypervolumens des Eingansdatenraums. Jedem Punkt im N-dimensionalen Eingangsdatenraum, dessen Koordinaten durch die Eingangsdaten eines Datensatzes gegeben sind, ist dann der Wert des Zieldatums des entsprechenden Datensatzes zugeordnet.each The input date can now assume different values, but these can be changed in are limited to their respective value range. So can one with 24V operated sensor e.g. only deliver voltages from 0V to 24V. As every date of receipt thus on a number line within the limited range of values is added by combining all N input data a record - after Kind of a vector - one N-dimensional hypercircuit or input data space spanned. The input data space is thus finite or limited. All conceivable Value combinations of input data are thus within the Hypervolumes of the input data space. Every point in the N-dimensional input data space, whose coordinates are given by the input data of a data set are the value of the target date of the corresponding record assigned.

Im erfindungsgemäßen Verfahren zum Auffinden eines fehlerhaften Datensatzes in einer Datensatzmenge von M Datensätzen wird mindestens einer der Wertebereiche eines Eingangsdatums in eine Anzahl Kn von Intervallen unterteilt. Im N-dimensionalen Eingangsraum bilden sich hierdurch insgesamt eine Anzahl

Figure 00050001
von N-dimensionalen Zellen bzw. Hyperquadern, also Teilräumen des Eingangsdatenraums. Diese sind begrenzt durch die Intervallgrenzen der Intervalle, weisen also jeweils die Intervalle als Kantenlängen auf.In the method according to the invention for finding a faulty data record in a set of data sets of M data records, at least one of the value ranges of an input datum is subdivided into a number K n of intervals. In the N-dimensional input space, this results in a total number
Figure 00050001
N-dimensional cells or hypercircuits, ie subspaces of the input data space. These are limited by the interval limits of the intervals, ie they each have the intervals as edge lengths.

Mindestens eine der so entstandenen Zellen wird als zu prüfende Zelle ausgewählt. Aus den Werten der Zieldaten der Datensätze wird sodann ein Prüfkriterium für die Zieldaten der Datensätze der ausgewählten Zelle ermittelt. Welche Datensätze hierbei die Grundlage zur Ermittlung des Prüfkriteriums bilden, kann verschieden sein. Das Prüfkriterium kann aus den Werten eines oder mehrerer oder aller Datensätze in einer oder mehreren oder allen Zellen ermittelt werden.At least one of the resulting cells is selected as the cell to be tested. Out The values of the target data of the data sets then become a test criterion for the Target data of the records the selected one Cell detected. Which data records here form the basis for determining the test criterion may vary be. The test criterion can from the values of one or more or all records in one or more or all cells.

Anhand des Prüfkriteriums werden die Werte der Zieldaten in der zu prüfenden Zelle geprüft. Geprüft werden also sämtliche Zieldaten sämtlicher Datensätze, welche mit den Werten ihrer Eingangsdaten in der zu prüfenden Zelle bzw. im jeweiligen Intervall des Wertebereiches der Eingangsdaten liegen. Mit anderen Worten werden die Datensätze geprüft, deren N-dimensionale Koordinaten in Form der Eingangsdaten im entsprechenden N-dimensionalen Hyperquader der zu prüfenden Zelle liegen.Based the test criterion The values of the target data in the cell to be checked are checked. Being checked so all Target data of all records which with the values of their input data in the cell to be tested or in the respective interval of the value range of the input data lie. In other words, the data sets whose N-dimensional coordinates are in the form of Input data in the corresponding N-dimensional hypercircuit the to be tested Cell lie.

Jeder Datensatz der ausgewählten Zelle, dessen Wert des Zieldatums das Prüfkriterium verfehlt, wird als fehlerhaft gekennzeichnet.Everyone Record of selected Cell whose value of the target date misses the check criterion is called incorrectly marked.

Es wird also nicht nur das Zieldatum, sonder der gesamte Datensatz als fehlerhaft klassifiziert. Da die Wahl von Eingangs- und Zieldaten eventuell willkürlich sein kann, deckt das erfindungsgemäße Verfahren also nicht nur Fehler im Zieldatum sondern im gesamten Datensatz auf.It So it's not just the target date, but the entire record classified as defective. Because the choice of input and destination data possibly arbitrary can be, the method of the invention therefore not only covers Error in the target date but in the entire record.

Da das Prüfkriterium aus den Werten der Zieldaten und damit auf Basis der den Daten zugrundeliegenden Prozesse bzw. Eigenschaften ermittelt wird, ist dieses wesentlich enger gefasst als die bisher bekannte Minimal-Maximal-Kontrolle oder Grenzwertkontrolle. Diese entspräche lediglich einer Überprüfung, ob denn die Eingangsdaten innerhalb des Eingangsdatenraums liegen.There the test criterion from the values of the target data and thus based on the underlying data Processes or properties is determined, this is essential narrower than the previously known minimum-maximum control or limit control. This would just be a check to see if because the input data is within the input data space.

Die Prüfkriterien sind in der Regel für jede Zelle unterschiedlich, so dass für unterschiedliche Datensätze, also Datensätze mit unterschiedlichen Eingangsdaten, unterschiedliche Prüfkriterium für deren Zieldaten gelten. In den Prüfkriterien lassen sich daher Plausibilitätsüberprüfungen integrieren, welche bisher nicht möglich waren.The test criteria are usually for each cell is different, so for different records, so records with different input data, different test criterion for their Target dates apply. In the test criteria Therefore plausibility checks can be integrated which not possible yet were.

Die als fehlerhaft gekennzeichneten Datensätze können z.B. einem Anlagenbetreiber angezeigt werden, so dass dieser die entsprechenden Datensätze genauer untersuchen kann. Somit liefert das Verfahren eine Art Vorfilterung zur Markierung verdächtiger Datensätze. Die Anzahl der vom Anlagenbetreiber tatsächlich händisch bzw. besonders zu überprüfenden Datensätze reduziert sich dadurch erheblich. Erweisen sich die verdächtigen Datensätze dann tatsächlich als fehlerhaft, so kann diese Erkenntnis einerseits zur Verbesserung z.B. der den Datensätzen zu Grunde liegenden Automatisierungsanlage benutzt werden. Andererseits können diese Datensätze von der weiteren Nutzung ausgeschlossen werden.The datasets marked as erroneous may e.g. a plant operator be displayed so that it more accurate the corresponding records can examine. Thus, the method provides some sort of prefiltering to mark suspect Records. The number of records actually manually or specially checked by the plant operator is reduced considerably. Then prove the suspicious records indeed as faulty, this knowledge can on the one hand to improve e.g. the records underlying automation system are used. on the other hand can these records be excluded from further use.

Die fehlerhaften Datensätze können Hinweise auf anderweitige Fehlerquellen liefern, z.B. Fehlerquellen die erst nach mehreren Prozessschritten zu einem fehlerhaften Zieldatum führten. An das Auffinden fehlerhafter Datensätze kann z.B. auch eine Alarmauslösung oder ähnliches geknüpft sein, wenn die Datensätze z.B. von einem Fertigungssystem stammen. Ein Alarmsystem ist allerdings erst dann sinnvoll, wenn die Zielkriterien über längere Zeit optimiert worden sind, so dass möglichst nur noch tatsächlich fehlerhafte Datensätze als fehlerhaft gekennzeichnet werden und die Fehlalarm-Quote ein akzeptables Maß nicht überschreitet.The faulty records can Provide indications of other sources of error, e.g. sources of error the first after several process steps to a faulty target date led. The finding of erroneous data records may be e.g. also an alarm trigger or similar linked be when the records e.g. come from a manufacturing system. An alarm system is, however only makes sense if the target criteria have been optimized over a longer period of time are, so that possible only actually bad records be marked as faulty and the false alarm rate an acceptable one Does not exceed measure.

Durch das erfindungsgemäße Verfahren ergeben sich hinsichtlich des Anlagenbetriebs eine effektivere Fehlersuche, eine schnellere Inbetriebsetzung, eine höhere Produktqualität und weniger Störfälle.By the inventive method arise in terms of plant operation more effective troubleshooting, faster commissioning, higher product quality and less Incidents.

Die Prüfkriterien passen sich im Laufe des Verfahrens bzw. der Zeit auch an jeweils neu erzeugte Datensätze, d.h. Wertekombinationen der Eingangs- und Zieldaten an, da sie aus diesen erstellt werden.The test criteria adapt in the course of the procedure or the time to each newly generated data records, i.e. Value combinations of the input and destination data as they are off to be created.

Die Intervalle für ein Eingangsdatum können durch äquidistante Teilung dessen Wertebereichs gebildet werden. Die äquidistante Teilung des Wertebereichs ist besonders einfach und ohne Vorwissen bzw. empirische Erfahrungen über die Zusammenhänge der Eingangsdaten untereinander bzw. zu den Zieldaten durchführbar. Hier kann z.B. eine feste Anzahl von Intervallen vorgegeben werden, die für alle Eingangsgrößen verwendet wird.The Intervals for An input date can be determined by equidistant Division of its value range are formed. The equidistant Division of the range of values is particularly simple and without prior knowledge or empirical experiences about contexts the input data with each other or to the target data feasible. Here can e.g. a fixed number of intervals are given, the used for all input variables becomes.

Die Intervalle für ein Eingangsdatum können aber auch unter Nutzung von Vorwissen über die Eingangs- und/oder Zieldaten gebildet werden. Vorwissen sind z.B. theoretische Überlegungen oder empirische Erfahrungen, dass bestimmte Unterteilungen besser als andere sind. Zum einen kann man wichtige Eingangsgrößen feiner unterteilen als unwichtige. Zum anderen kann man eine nicht äquidistante Unterteilung so wählen, dass der Anstieg der Zielgröße innerhalb einer Zelle für alle Zellen in etwa gleich ist.The Intervals for but an input date can also by using prior knowledge of the input and / or Target data are formed. Previous knowledge is e.g. theoretical considerations or empirical experiences that make certain subdivisions better than others are. On the one hand you can finer important input quantities subdivided as unimportant. On the other hand, one can not be equidistant Choose subdivision so that the increase in the target size within a cell for all cells are about the same.

Als Prüfkriterium wird für jede Zelle ein eigener lokaler Toleranzbereich für den Wert des Zieldatums ermittelt, der deutlich enger ist als der global zulässige Wertebereich. Somit werden mathematische Bedingungen geschaffen, um Datensätze bzw. Zieldaten gegen die Prüfkriterien zu testen. Ein derartiges Prüfkriterium ist also einfach und schnell auswertbar, was das gesamte Verfahren stark beschleunigt.When criterion is for each cell determines its own local tolerance range for the value of the target date, which is significantly narrower than the globally permissible value range. Thus be created mathematical conditions to record or target against the test criteria to test. Such a test criterion So it's easy and fast to evaluate what the whole process is strongly accelerated.

Der lokale Toleranzbereich besteht aus einem Sollwert und einer zulässigen Abweichung. Sollwert und zulässige Abweichung im Prüfkriterium können durch statistische Methoden aus Werten der Zieldaten ermittelt werden. Auf welche Datenbasis, d.h. welche Datensätze aus welchen Zellen, hierbei die statistischen Methoden angewandt werden, ist wie oben beschrieben, auf verschiedene Weise möglich.Of the Local tolerance range consists of a setpoint and a permissible deviation. Setpoint and allowed Deviation in the test criterion can determined by statistical methods from values of the target data. On which database, i. which data records from which cells, here the statistical methods are applied, as described above, possible in different ways.

Gerade statistische Methoden eignen sich besonders dazu, nicht explizit nachvollziehbare und diesbezüglich zufällige Vorgänge – im vorliegenden Fall die Reststreuung des Zielwertes bei bekannten Eingangsdaten -, welche jedoch dennoch eine Struktur besitzen – also eben nur eine relativ geringe Reststreuung bei ansonsten guter Reproduzierbarkeit des Zielwertes-, zahlenmäßig zu erfassen.Just Statistical methods are particularly suitable, not explicit comprehensible and in this regard random Operations - in the present case the residual dispersion of the target value with known input data - which but still have a structure - so just a relative low residual scattering with otherwise good reproducibility of the target value, to record in numbers.

Liegen in einer Zelle Zielwerte gehäuft in einem gewissen Wertebereich, so ist davon auszugehen, dass einzelne, außerhalb dieses Wertebereiches liegende Werte fehlerhaft sind. Der Sollwert im Zielkriterium kann daher als Mittelwert aller Zieldaten der Datensätze der ausgewählten Zelle ermittelt werden. Der einzelne fehlerhafte Wert wird dann den Mittel wert kaum verändern. Fehlerhaft Werte können dann auf Grund eines besonders großen Abstandes zum Mittelwert erkannt werden. Die Suche fehlerhafter Datensätze wird mit anderen Worten von einem lokalen, also nur für die jeweilige Zelle ermittelten Wert durchgeführt.If target values accumulate in a cell in a certain value range, it can be assumed that individual values lying outside this range of values are faulty. The target value in the target criterion can therefore be determined as the mean value of all target data of the data records of the selected cell. The single erroneous value will hardly change the mean value. Faulty values can then be detected due to a particularly large distance to the mean value. In other words, the search for erroneous data records is from a local, that is determined only for the respective cell Value performed.

Die zulässige Abweichung vom lokalen Sollwert wird vorteilhafterweise aus der über alle Zellen gemittelten lokalen Standardabweichung berechnet. Natürlich können auch andere, der Standardabweichung vergleichbare Maße wie z.B. die Streuung hierzu verwendet werden. Die Gewichtung bzw. ein multiplikativer Gewichtsfaktor bestimmt hierbei die tatsächliche Weite des Toleranzbereiches und kann z.B. empirisch ermittelt werden.The allowed Deviation from the local setpoint is advantageously made over all Cells average local standard deviation calculated. Of course you can too other dimensions comparable to the standard deviation, e.g. the scatter for this be used. The weighting or a multiplicative weighting factor determines the actual Width of the tolerance range and can e.g. be determined empirically.

Die Verwendung der lokalen Standardabweichung (der Zielgröße innerhalb einer Zelle für die Berechnung der zulässigen Abweichung) ist zwar prinzipiell möglich, aber ungünstiger, da sie durch die fehlerhaften Datensätze stärker verfälscht wird, als die über alle Zellen gemittelte Standardabweichung.The Use of the local standard deviation (the target size within a cell for the calculation of the permissible Deviation) is possible in principle, but less favorable, because it is falsified more by the erroneous records than the over all Cells averaged standard deviation.

Anstelle der Mittelung der lokalen Streuungen kann auch für alle Datensätze die globale Streuung des Zielwertes ermittelt werden, also ohne Berücksichtigung der Zellengrenzen. Anschließend kann der Toleranzbereich durch Gewichtung der globalen Streuung ermittelt werden. Diese Verfahrensvariante schafft ein alternatives Maß zur Beurteilung fehlerhafter Datensätze unter Berücksichtigung aller Datensätze. Die erwähnten alternativen Maße sind für bestimmte Anwendungsfälle mehr oder weniger geeignet. Welche Variante für welchen Anwendungsfall die beste ist, kann meist durch Erfahrungswerte oder Vorabtest ermittelt werden.Instead of The averaging of the local scatters can also be used for all records global dispersion of the target value are determined, ie without consideration the cell boundaries. Then you can the tolerance range is determined by weighting the global variance become. This variant of the method provides an alternative measure for assessing faulty ones records considering all records. The mentioned alternative dimensions are for certain applications more or less suitable. Which variant for which application the best is, can usually be determined by empirical values or preliminary testing become.

Alternativ zu den aus allen Daten oder den Daten der zu untersuchenden Zelle ermittelten statistischen Maßen können auch Vorhersagen über die zu untersuchende Zelle zur Beurteilung der Fehlerhaftigkeit von Datensätzen der zu untersuchenden Zelle benutzt werden. Im Verfahren kann daher ein empiri sches Modell zur Abbildung der Eingangsdaten auf die Zieldaten erstellt werden, so dass das Zielkriterium dann für die ausgewählte Zelle mit dem empirischen Modell ermittelt werden kann. Durch die Verwendung eines empirischen Modells kann versucht werden, die Beziehungen zwischen Zieldaten und Eingangsdaten nachzubilden. Mit anderen Worten wird dadurch versucht, eine Prädiktion für den Wert des Zieldatums bei gegebenen Eingangsdaten in der zu untersuchenden Zelle zu erstellen. Anschließend wird dann geprüft, ob die Zielwerte in der Zelle außerhalb eines Toleranzbereiches um den Prädiktionswert liegen, um sie gegebenenfalls als fehlerhaft zu markieren.alternative to all data or data of the cell to be examined determined statistical measures can also predictions about the cell to be examined for the assessment of the defectiveness of records the cell to be examined are used. In the procedure can therefore an empirical model for mapping the input data to the target data be created, so that the target criterion for the selected cell can be determined with the empirical model. By use an empirical model can be tried to relationships to emulate between target data and input data. In other words, will by trying a prediction for the Value of the target date for given input data in the to be examined Cell to create. Subsequently, will then tested, whether the target values in the cell are outside a tolerance range around the prediction value to mark them as faulty if necessary.

Verschiedenste Arten empirischer Modelle können verwendet werden, wie z.B. ein Multilayer-Perzeptron (MLP), also ein nichtlineares neuronales Netz oder ein aus der DE 102 03 787.6 bekanntes Just-in-Time-Modelling (JIT) ohne Zeitterm. In wenigen Worten beschrieben, wird dort ein gewichteter Mittelwert aller Datensätze erzeugt, wobei sich die Gewichtung aus dem N-dimensionalen Hyperabstand der jeweiligen Eingangsdaten, also des Eingangsdatenvektors, zum Mittelpunkt der untersuchten Zelle ergibt. Im Hyperraum nahe liegende Datensätze werden also am stärksten gewichtet. Eine Normierung kann hierbei z.B. anhand der Kantenlängen der Zellen, also der Intervalle, in welchen die Wertebereiche unterteilt wurden, durchgeführt werden. Ein derartiges Vorgehen ist besonders von der Kantenlänge der Zellen abhängig, weshalb sich in diesem Fall eine manuelle Teilung der Wertebereiche empfiehlt. Die Vorteile eines JIT gegenüber einem MLP sind dessen höhere Genauigkeit und die geringere Rechenzeit, da die für das MLP notwendige Lernphase entfällt.Various types of empirical models can be used, such as a multilayer perceptron (MLP), ie a nonlinear neural network or one of the DE 102 03 787.6 well-known just-in-time modeling (JIT) without timetable. Described in a few words, a weighted average of all data sets is generated there, whereby the weighting results from the N-dimensional hyper distance of the respective input data, ie the input data vector, to the center of the examined cell. Data sets close to hyperspace are therefore most heavily weighted. In this case, a normalization can be carried out, for example, based on the edge lengths of the cells, that is to say the intervals in which the value ranges have been subdivided. Such a procedure is particularly dependent on the edge length of the cells, which is why a manual division of the value ranges is recommended in this case. The advantages of a JIT over an MLP are its higher accuracy and reduced computation time, since the learning phase required for the MLP is eliminated.

Bei der Ermittlung des Zielkriteriums kann die zu untersuchende Zelle ausgeschlossen werden, d.h. das Zielkriterium wird dann auf Basis aller oder einer Teilmenge aller Zellen, außer der zu untersuchenden Zelle, ermittelt. Fehlerhafte Werte in der zu untersuchenden Zelle bzw. fehlerhafte Datensätze gehen somit nicht in die Ermittlung des Zielkriteriums mit ein. Das Zielkriterium wird durch fehlerhafte Datensätze der zu untersuchenden Zelle nicht verfälscht.at The determination of the target criterion can be performed by the cell to be examined be excluded, i. the target criterion is then based on all or a subset of all cells except the cell to be examined, determined. Defective values in the cell to be examined or faulty records go thus not included in the determination of the target criterion. The target criterion is due to faulty records the cell to be examined not falsified.

Befinden sich in einer Zelle mindestens zwei Gruppen (Cluster) von Datensätzen, die bezüglich ihrer Zielwerte jeweils eng beieinander liegen, zwischen denen aber eine Lücke klafft, die größer ist als z.B. die lokale Sperrung, so besteht der Verdacht, dass nur eine dieser Datengruppen korrekt ist, die andere, bzw. die anderen Datengruppen, fehlerhaft sind. Zellen mit mehreren Datengruppen (Clustern) werden im folgenden als heterogene Zellen bezeichnet. Je mehr Daten sich dabei in einer fehlerhaften Datengruppe befinden, desto unwahrscheinlicher wird es, dass die Methode der lokalen Mittelwertbildung diese Daten erkennt. Dann hilft nur die oben beschriebene Methode der empirischen Modellierung unter Ausschluss aller Daten aus der betrachteten heterogenen Zelle.Are located There are at least two groups (clusters) of records in a cell in terms of their target values are close to each other, but between them a gap gapes, which is bigger as e.g. the local blocking, there is a suspicion that only one of these data groups is correct, the other one or the other Data groups are faulty. Cells with multiple data groups (Clusters) are referred to below as heterogeneous cells. The more data that is in a bad data group, the more unlikely it becomes that the method of local averaging recognizes this data. Then only the method described above will help the empirical modeling to the exclusion of all data from the considered heterogeneous cell.

Eine mögliche Methode zum Auffinden „heterogener" Zellen, d.h. Zellen mit mehreren Datengruppen, kann wie folgt ablaufen: Die Zielwerte der ausgewählten Zelle werden nach ihrer Größe sortiert, die Differenzen je zweier benachbarter Zielwerte werden ermittelt und Differenzen, die größer einem Lückengrenzwert sind, werden als Lücke definiert. So entsteht eine stetig steigende Aneinanderreihung von Zielwerten in der zu untersuchenden Zelle, welche je nachdem ohne Lücke oder unter Zwischenschaltung von Lücken aneinander grenzen. Datensätze mit Zielwerten, die ohne Lücken aneinander grenzen, werden zu Clustern zusammengefasst. Alle Datensätze eines Clusters in einer Zelle werden dann in Abhängigkeit des Zielkriteriums gemeinsam als fehlerhaft oder nicht fehlerhaft gekennzeichnet. Mit einer derartigen Verfahrensvariante, können ganze Ansammlungen bzw. Gruppen, eben die Cluster, fehlerhafter Datensätze ermittelt werden.One possible method for finding "heterogeneous" cells, ie cells with multiple data groups, can be as follows: The target values of the selected cell are sorted according to their size, the differences of each two adjacent target values are determined, and differences greater than a gap threshold are obtained This creates a steadily increasing number of target values in the cell to be examined, each of which adjoins each other without gap or with the interposition of gaps: Data sets with target values that adjoin one another without gaps are grouped together in clusters in a cell are then together depending on the target criterion as feh lerhaft or not marked faulty. With such a method variant, whole accumulations or groups, just the clusters, of erroneous data sets can be determined.

Zur Überprüfung auf Fehlerhaftigkeit werden dann die Zielwerte nicht gegen ein in der zu unersuchenden Zelle ermitteltes Prüfkriterium, sondern gegen ein aus den umliegenden Zellen oder den restlichen Zellen oder allen Zellen ermittelte Prüf kriterium getestet. Diese stammen dann z.B. aus dem oben beschriebenen empirischen Modell.For review Deficiency then the target values are not against in the to test cell determined test criterion, but against a from the surrounding cells or the remaining cells or all Cell tested test criterion. These are then e.g. from the empirical model described above.

Nach Clusterbildung kann dann für jeden Cluster der Mittelwert der zugehörigen Zielwerte des Clusters ermittelt und mit dem Zielkriterium geprüft werden. Durch die Clusterbildung und die getrennte Bewertung mit dem Zielkriterium über entsprechende Mittelwerte kann mit anderen Worten eine Untergruppierung in Zellen erfolgen. Auch diese Maßnahme dient dazu, fehlerhafte Cluster in ihrer Gesamtheit von nicht fehlerhaften zu unterscheiden.To Clustering can then be used for each cluster is the average of the associated target values of the cluster determined and checked with the target criterion. By clustering and the separate evaluation with the target criterion on corresponding averages In other words, subgrouping can be done in cells. This measure also serves in addition, faulty clusters in their entirety are not faulty to distinguish.

Das Prüfkriterium in einer zu prüfenden Zelle kann auch so ermittelt werden, dass alle Datensätze einer Zelle außer des dem Prüfkriterium am nächsten kommenden Datensatzes oder Clusters als fehlerhaft gekennzeichnet werden. Durch eine derartige Verfahrensvariante wird sichergestellt, dass lediglich ein einziger Cluster in einer heterogenen Zelle oder ein einziger Datensatz in einer Zelle als korrekt, und alle anderen als fehlerhaft gekennzeichnet werden. Das Prüfkriterium stellt mit anderen Worten ein „best fit"-Kriterium dar.The criterion in a to be tested Cell can also be determined so that all records have one Cell except of the test criterion next Record or cluster marked as bad. By such a variant of the method ensures that only a single cluster in a heterogeneous cell or a single one Record in one cell as correct, and all others as incorrect be marked. The test criterion In other words, it is a "best fit" criterion.

Wie bereits erwähnt, können durch die verschiedenen Verfahrensvarianten einzelne Ausreißer von Zielwerten in zu untersuchenden Zellen, ganze Cluster fehlerhafter Werte innerhalb einer Zelle, oder alle Datensätze einer zu untersuchenden Zelle als fehlerhaft erkannt und markiert werden. Am geeignetsten um sämtliche fehlerhafte Datensätze zu erkennen, erscheint die Möglichkeit, in einem ersten Verfahrensdurchlauf wie oben beschrieben, einzelne fehlerhafte Datensätze, also die Ausreißer, zu suchen und zu eliminieren, in den verbleibenden Datensätzen fehlerhafte Cluster zu suchen und zu eliminieren, und anschließend noch gesamte fehlerhafte Zellen zu suchen und ebenfalls zu eliminieren.As already mentioned, can through the various process variants individual outliers of Target values in cells to be examined, whole clusters more defective Values within a cell, or all records of one to be examined Cell detected as defective and marked. Most appropriate around all bad records recognizing the possibility of in a first process run as described above, single faulty ones records So the outliers, to search and eliminate, in the remaining records erroneous Cluster to search and eliminate, and then still to search for and also eliminate entire faulty cells.

Eliminieren bedeutet hierbei, nach Auffinden eines fehlerhaften Datensatzes diesen von der weiteren Untersuchung auszuschließen. Die Zielkriterien in einem folgenden Schritt wer den dann auf einer neuen Datenbasis, nämlich unter Ausschluss der bisher gefundenen fehlerhaften Daten, ermittelt. Die Zielkriterien werden so im Laufe des Verfahrens stets verbessert, da immer mehr fehlerhafte Werte aus deren Datenbasis entfernt werden.Eliminate means here after finding a faulty record to exclude this from the further investigation. The target criteria in one The following step who the then on a new database, namely Exclusion of the previously found erroneous data, determined. The target criteria are thus always improved in the course of the procedure, as more and more erroneous values are removed from their database.

Es kann auch vorteilhaft sein, jeden der einzelnen Prozess-Schritte mehrfach auszuführen, oder die gesamte Filter-Prozedur ein zweites Mal durchzuführen.It may also be advantageous, multiple of each of the individual process steps perform, or to perform the entire filter procedure a second time.

Für eine weitere Beschreibung der Erfindung wird auf die Ausführungsbeispiele der Zeichnungen verwiesen. Es zeigen, jeweils in einer schematischen Prinzipskizze:For another Description of the invention is directed to the embodiments of the drawings. They show, in each case in a schematic outline sketch:

1 ein Walzwerk für Stahlbänder mit Anlagensteuerung und neuronalem Netzwerk in stark vereinfachter Darstellung, 1 a rolling mill for steel belts with plant control and neural network in a very simplified representation,

2 im Walzwerk aus 1 erzeugte Datensätze mit zwei Eingangswerten und einem Zielwert, 2 in the rolling mill 1 generated records with two input values and a target value,

3 ein Diagramm der Zielwerte der Datensätze aus 2, aufgetragen über den Eingangsdaten, 3 a graph of the target values of the records 2 , plotted against the input data,

4 ein Flussdiagramm für ein Verfahren zum Auffinden fehlerhafter Datensätze. 4 a flow chart for a method for finding faulty records.

1 zeigt ein Stahlwalzwerk 2 mit einer entsprechenden Anlagensteuerung 4 in stark vereinfachter Darstellung. Im Stahlwalzwerk 2 wird Rohmaterial 6, nämlich Metall-Brammen, durch die symbolisch angedeuteten Walzen zu einem Metallband 8 als Ausgangsprodukt des Walzwerkes 2 gewalzt. 1 shows a steel mill 2 with a corresponding system control 4 in a very simplified representation. In the steel mill 2 becomes raw material 6 , namely metal slabs, through the symbolically indicated rollers to a metal band 8th as the starting product of the rolling mill 2 rolled.

Die Anlagensteuerung 4 umfasst zwei Sensoren 10a, b, wobei der Sensor 10a die Breite b des Rohmaterials 6 und der Sensor 10b die Walzkraft F im Stahlwalzwerk 2 erfasst. Die Anlagensteuerung 4 umfasst außerdem eine Tastatur 12, über die ein nicht dargestellter Arbeiter, welcher dem Stahlwalzwerk 2 das Rohmaterial 6 zuführt, den Kohlenstoffgehalt c des Rohmaterials 6 als Zahlenwert in Prozent eingibt.The plant control 4 includes two sensors 10a , b, where the sensor 10a the width b of the raw material 6 and the sensor 10b the rolling force F in the steel rolling mill 2 detected. The plant control 4 also includes a keyboard 12 , on which an unrepresented worker, who is the steel rolling mill 2 the raw material 6 feeds, the carbon content c of the raw material 6 as numerical value in percent.

Zur Steuerung bzw. Überwachung des Walzprozesses im Stahlwalzwerk 2 ist in der Anlagensteuerung 4 ein neuronales Netz 14 integriert. Das neuronale Netz 14 bildet den Stahlwalzprozess nach und errechnet bei Kenntnis von Breite b und Kohlenstoffgehalt c des Rohmaterials 6 die zu erwartende bzw. resultierende Walzkraft F, noch bevor das Metallband 8 gefertigt ist. Das neuronale Netz 14 erstellt somit eine Prädiktion des während des Walzprozesses, also zu einem späteren Zeitpunkt, gemessenen Wertes F.For controlling or monitoring the rolling process in the steel rolling mill 2 is in the plant control 4 a neural network 14 integrated. The neural network 14 replicates the steel rolling process and, knowing width b and carbon content, calculates c of the raw material 6 the expected or resulting rolling force F, even before the metal strip 8th is made. The neural network 14 thus creates a prediction of the value F. measured during the rolling process, that is to say at a later point in time.

Zu jedem einzelnen Stück Rohmaterial 6 welches zu einem Metallband 8 gewalzt wird, existiert damit ein Datensatz 16, welcher drei Einzeldaten 18a-c bzw. Variablen umfasst, die jeweils Zahlenwerte, nämlich die Breite b in mm, den Kohlenstoffgehalt c in Prozent und die Walzkraft F in kN eines bestimmten individuellen Rohmaterials 6 bzw. daraus erstellten Metallbandes 8 als Werte enthalten.To every single piece of raw material 6 which to a metal band 8th is rolled, so there is a record 16 , which three individual data 18a -c or variables, each of which numerical values, namely the width b in mm, the carbon content c in percent and the rolling force F in kN of a bestimm individual raw materials 6 or created from this metal strip 8th as values.

An einem bestimmten Produktionstag werden in einem Stahlwalzwerk 2 insgesamt eine Anzahl von M Metallbändern 8 gefertigt. In der Anlagensteuerung 4 fallen daher insgesamt M Datensätze 16 an, welche in 2 dargestellt sind.On a given production day will be in a steel mill 2 a total of a number of M metal bands 8th manufactured. In the plant control 4 Therefore, a total of M records fall 16 which in 2 are shown.

Für das Stahlwalzwerk 2 sind folgende Rahmenbedingungen bekannt: Die Breite b des Rohmaterials 6 kann lediglich zwischen 1100mm und 1400mm variieren, da nur solches Rohmaterial 8 eingekauft bzw. verarbeitet wird. Die Konzentration c des Kohlenstoffgehaltes im Rohmaterial 6 ist von dessen Hersteller garantiert und liegt zwischen 0,30% und 0,60%. Andere Rohmaterialien werden im Walzwerk 2 definitiv nicht verarbeitet. Als Ausgangsprodukt des Stahlwalzwerkes, also als Metallband 8 werden lediglich solche gewalzt, deren Walzkraft F zwischen 200kN und 2000kN liegt, da dies die mechanisch von der Anlage vorgegebenen Werte sind. Metallbänder 8 mit anderen Werten können das Walzwerk 2 definitiv nicht verlassen.For the steel mill 2 the following framework conditions are known: The width b of the raw material 6 can vary only between 1100mm and 1400mm, because only such raw material 8th purchased or processed. The concentration c of the carbon content in the raw material 6 is guaranteed by its manufacturer and is between 0.30% and 0.60%. Other raw materials are in the rolling mill 2 definitely not processed. As a starting product of the steel mill, so as a metal strip 8th Only those are rolled whose rolling force F is between 200kN and 2000kN, as these are the values mechanically determined by the system. metal bands 8th with other values, the rolling mill 2 definitely not left.

Die M Datensätze 16 sollen nun auf fehlerhafte Datensätze 16 überprüft werden, d.h. fehlerhafte Datensätze 16 sollen ge funden und als fehlerhaft markiert werden. Gemäß Stand der Technik wurden bisher durch eine nicht dargestellte Recheneinheit in der Anlagensteuerung 4 lediglich die Intervallgrenzen der Größen b, c und d, also die Einzeldaten 18a-c überprüft. Z.B. wurden Datensätze 16 deren Werte c < 0,30% oder c > 0,60% waren, als fehlerhaft markiert. Eine derartige Angabe kann nach obigen Voraussetzungen z.B. lediglich ein Eingabefehler an der Tastatur 12 sein, da definitiv bekannt ist, dass Materialien mit einem derartigen Kohlenstoffgehalt c nicht verwendet werden. Derartige Datensätze 16 sind in 2 bereits aussortiert. Die Werte b, c und F sämtlicher Datensätze in 2 liegen also innerhalb der erlaubten Bereichsintervalle für die Einzeldaten 18a-c.The M records 16 should now on erroneous records 16 be checked, ie incorrect records 16 should be found and marked as faulty. According to the prior art, hitherto have not been shown by a computing unit in the plant control 4 only the interval limits of sizes b, c and d, ie the individual data 18a -c checked. For example, records were 16 whose values were c <0.30% or c> 0.60%, marked as faulty. Such an indication can according to the above requirements, for example, only an input error on the keyboard 12 Since it is definitely known that materials having such carbon content c are not used. Such records 16 are in 2 already sorted out. The values b, c and F of all records in 2 lie within the allowed range intervals for the individual data 18a c.

Zur Durchführung des erfindungsgemäßen Verfahrens wird nun in allen Datensätzen 16 ein Datum, nämlich das Einzeldatum 18c bzw. die Walzkraft F, als Zieldatum bzw. Zielwert für das Verfahren gewählt. Die Einzeldaten 18a, b, bzw. Breite b und Kohlenstoffgehalt c, werden als zwei Eingangsdaten bzw. Eingangswerte für das Verfahren gewählt. Damit gilt N = 2. Diese Wahl ist bereits daher sinnvoll, da die Walzkraft F sich auch tatsächlich im Walzprozess aufgrund der Einstellungen, z.B. Walzenposition, Verarbeitungstemperatur usw., des Walzwerkes 2, vor allem aber zwangsweise aus den Werten b und c ergibt. Da mit den Einzeldaten 18a, b im stark vereinfachten Beispiel – alle restlichen Parameter des Walzwerks 2 sind konstant – sämtliche Einflussgrößen auf die Walzkraft F bekannt sind, wird sich, abgesehen von Fertigungstoleranzen, bei gegebenem Wertepaar Breite b und Kohlenstoffgehalt c eine stets etwa gleiche Walzkraft F einstellen.To carry out the method according to the invention is now in all data sets 16 a date, namely the single date 18c or the rolling force F, chosen as the target date or target value for the process. The individual data 18a , b, and width b and carbon content c, respectively, are selected as two input data and input values for the method, respectively. Thus N = 2 applies. This choice makes sense already because the rolling force F actually in the rolling process due to the settings, eg roller position, processing temperature, etc., of the rolling mill 2 , but above all forcibly from the values b and c. As with the individual data 18a , b in the simplified example - all remaining parameters of the rolling mill 2 are constant - all factors influencing the rolling force F are known, except for manufacturing tolerances, for a given pair of values width b and carbon content c is always about the same rolling force F set.

In 3 sind sämtliche M-Datensätze 16 graphisch dargestellt. Die Eingangsdaten 18a, b, also die Werte b und c spannen innerhalb ihrer erlaubten Wertebereiche W1 und W2 einen, da N = 2 gilt, zweidimensionalen Eingangsraum 20 auf. Sämtliche Wertepaare der Eingangsdaten 18a, b müssen also, nach Vorabausgrenzung unplausibler Werte gemäß Stand der Technik, wie oben erläutert, innerhalb des Eingangsraums 20 liegen. Im Eingangsraum 20 sind die Datensätze mit den Nummern 1-3, M-1 und M jeweils durch ein beschriftetes Kreuz markiert. Die Werte der Einzeldaten 18a, b bilden hierbei die kartesischen Koordinaten.In 3 are all M records 16 shown graphically. The input data 18a , b, so the values b and c span within their allowed value ranges W 1 and W 2 , since N = 2, two-dimensional input space 20 on. All value pairs of the input data 18a Thus, after predistinction of implausible values according to the prior art, as described above, b must be within the input space 20 lie. In the entrance room 20 the records with the numbers 1-3, M-1 and M are each marked by a labeled cross. The values of the individual data 18a , b form the Cartesian coordinates.

Im Verfahren gemäß 4 wird in einem ersten Schritt 38 der Wertebereich der Einzeldaten 18a, b in jeweils drei gleichgroße Intervalle I11 bis I13 und I21 bis I23 aufgeteilt. Durch die Aufteilung in Intervalle I11 bis I23 wird der Eingangsraum 20 in neun Zellen Z11 bis Z33 geteilt.In the method according to 4 will be in a first step 38 the value range of the individual data 18a , b divided into three equally large intervals I 11 to I 13 and I 21 to I 23 . By dividing into intervals I 11 to I 23 , the input space 20 divided into nine cells Z 11 to Z 33rd

Sämtliche M Datensätze 16 liegen somit jeweils eindeutig in einer der neuen Zellen Z11 bis Z33. So liegen beispielsweise in der Zelle Z31 sämtliche Datensätze 16, deren Breite b zwischen 1300mm und 1400mm und deren Kohlenstoffgehalt c zwischen 0,30% und 0,40% liegt. Jeder dieser Datensätze weist hierbei einen Zielwert, nämlich eine Walzkraft F auf. Die Verteilung der jeweiligen Walzkräfte F ist in 4 für jede der Zellen Z11 bis Z33 separat als Histogramm f11 bis f33 aufgetragen. Jedes Histogramm zeigt für die jeweilige Walzkraft F als Abszisse die Häufigkeit der Walzkräfte F auf der Ordinate angetragen. Zum Beispiel tragen zum Histogramm f32 der Zelle Z32 die in der Zelle Z32 liegenden Datensätze 16 mit den Nummern 1 und M bei. Die entsprechenden Walzkräfte F von 1800kN und 1200kN sind auf der F-Achse des Histogramms f32 ebenfalls durch Kreuze markiert.All M records 16 are thus each unique in one of the new cells Z 11 to Z 33 . For example, in cell Z 31, all data sets are located 16 whose width b is between 1300mm and 1400mm and whose carbon content c is between 0.30% and 0.40%. Each of these data records has a target value, namely a rolling force F. The distribution of the respective rolling forces F is in 4 for each of the cells Z 11 to Z 33 separately plotted as histogram f 11 to f 33 . Each histogram shows for the respective rolling force F as abscissa the frequency of the rolling forces F plotted on the ordinate. For example, the histogram f 32 of cell Z 32 carries the data sets lying in cell Z 32 16 with the numbers 1 and M at. The corresponding rolling forces F of 1800kN 1200kN and are also marked on the F-axis of the histogram f 32 through crosses.

Zum Auffinden fehlerhafter Datensätze 16 wird im nächsten Schritt 40 wird für jede der neun Zellen Z11 bis Z33 ein Mittelwert F 11 bis F 33 und eine Standardabweichung σ11 bis σ33 berechnet. Im Beispiel gemäß 3 ergibt sich z.B. für die Zelle 31 ein Mittelwert F 11 von 1400kN und eine Standardabweichung σ11 von 230N.To find faulty records 16 will be in the next step 40 For each of the nine cells Z 11 to Z 33 becomes an average value F 11 to F 33 and a standard deviation σ 11 to σ 33 is calculated. In the example according to 3 results eg for the cell 31 an average F 11 of 1400kN and a standard deviation σ 11 of 230N.

Anschließend wird in einem Schritt 31 die mittlere lokale Streuung σ loc berechnet, als gemittelter Wert aller Streuungen von σ11 bis σ33. Im Beispiel ergibt sich σ loc = 250N. Gleichzeitig wird die globale Streuung σglob aller Werte F sämtli cher M Datensätze 16 als Differenz des Maximalwertes von F und des Minimalwertes von F ermittelt.Subsequently, in one step 31 the mean local dispersion σ loc calculated, as averaged value of all scatters from σ 11 to σ 33 . The example shows σ loc = 250N. At the same time, the global spread σ glob of all values F of all M data sets becomes 16 determined as the difference between the maximum value of F and the minimum value of F.

In der Schleife 42 wird anschließend für jede der Zellen Z11 bis Z33 einmal als zu prüfende Zelle ausgewählt. In der ausgewählten Zelle wird geprüft, ob diese Datensätze 16 enthält, deren Walzkraft F um mehr als α σ loc vom entsprechenden Mittelwert F 11 bis F 33 der Zelle abweicht. Diese Prüfung stellt also das erfindungsgemäße Prüfkriterium dar. Datensätze 16, für welche diese Bedingung erfüllt ist, werden als fehlerhaft markiert und von der weiteren Betrachtung ausgeschlossen. Im Beispiel der Zelle Z31 ist z.B. ein Datensatz 16 enthalten, dessen Walzkraft F bei 300kN liegt. Dieser ist in 3 als Fehldatum 22 gekennzeichnet. Als Parameter α ist in Zelle Z31 der Wert drei gewählt. Vom Mittelwert F 13 liegt das Fehldatum 22 um mehr als 3σ loc entfernt. Dieser Datensatz wird damit als ungültig markiert und von der weiteren Betrachtung ausgeschlossen.In the loop 42 is then selected once for each of the cells Z 11 to Z 33 once as a cell to be tested. In the selected cell, it is checked if these records 16 whose rolling force F exceeds by more than α σ loc from the corresponding mean F 11 to F 33 the cell deviates. This test thus represents the test criterion according to the invention. Data records 16 for which this condition is met are marked as faulty and excluded from further consideration. In the example of the cell Z 31 is eg a record 16 included, whose rolling force F is 300kN. This one is in 3 as a missed date 22 characterized. As parameter α, the value three is selected in cell Z 31 . From the mean F 13 is the wrong date 22 more than 3 σ loc away. This data record is thus marked as invalid and excluded from further consideration.

Mit anderen Worten werden in der Schleife 42 einzelne Datensätze 16, die hinsichtlich ihrer Einzeldaten 18a-c von der Mehrzahl der anderen Datensätze 16 abweichen, also sogenannte „Ausreißer", erkannt und als ungültige Datensätze 16 markiert.In other words, be in the loop 42 individual records 16 , in terms of their individual data 18a -c of the majority of other records 16 differ, so-called "outliers", recognized and as invalid records 16 marked.

Die Schleife 42 beschreibt die erste Möglichkeit, fehlerhafte Datensätze 16 zu identifizieren. Die Schleife 42 kann alleine oder in Kombination mit den weiter unten aufgeführten anderen Verfahrensvarianten durchgeführt werden. Die Schritte 4042 können mehrfach wiederholt werden, so lange, bis keine fehlerhaften Daten bzw. Fehldaten 22 mehr gefunden werden.The bow 42 describes the first way of corrupting records 16 to identify. The bow 42 may be carried out alone or in combination with the other process variants listed below. The steps 40 - 42 can be repeated several times, until no faulty data or incorrect data 22 more can be found.

Sinnvollerweise werden die genannten Verfahrensvarianten jedoch in der hier in 4 aufgeführten Reihenfolge nacheinander durchgeführt. Die in der Schleife 42 erkannten fehlerhaften Datensätze werden aus der Gesamtmenge aller Datensätze 16 entfernt, die folgenden Untersuchungen also bereits an einer vorgefilterten Menge bzw. Untermenge der ursprünglichen M Da tensätze durchgeführt. Durch die Eliminierung fehlerhafter Datensätze werden die statistischen Maße etc. wie z.B. die Mittelwerte F oder Standardabweichungen σ genauer, d.h. sie entsprechen mehr und mehr den Werten für einen fehlerfreien und korrekten Prozessablauf und den damit assoziierten Werten der Einzeldaten 18a-c in den Datensätzen 16.However, the mentioned process variants are usefully used in the here in 4 order listed sequentially performed. The in the loop 42 detected erroneous records are taken from the total of all records 16 Thus, the following examinations have already been performed on a prefiltered set or subset of the original M records. By eliminating erroneous records, the statistical measures, etc., such as the mean values F or standard deviations σ more precisely, ie they more and more correspond to the values for an error-free and correct process flow and the associated values of the individual data 18a -c in the records 16 ,

Zur Identifizierung weiterer fehlerhafter Datensätze schließt sich an die Schleife 42 ein Sortierschritt 44 an. Im Sortierschritt 44 werden für jede zu prüfende Zelle Z11 bis Z33 jeweils die Einzeldaten 18c, also die Walzkräfte F aller Datensätze 16 der entsprechenden Zelle ihrer Größe nach, also aufsteigend bzw. absteigend sortiert. In 3 ist dies durch die Darstellung als Histogramm f11 bis f33 sowieso schon gezeigt, in 4 nochmals explizit dargestellt. Zwischen jeweils zwei benachbarten Walzkräften F werden deren Abstände 26 ermittelt. Abstände 26, welche größer sind als einem Grenzwert β σ loc sind, werden als Lücke 28 identifiziert. Im Beispiel wurde der Wert des Parameters β = 2 gewählt. Datensätze 16 mit Walzkräften F, welche ohne eine Lücke 28 zusammenhängen, werden zu Clustern bzw. Gruppen 30a, b zusammengefasst.To identify further erroneous data records closes to the loop 42 a sorting step 44 at. In the sorting step 44 For each cell to be tested Z 11 to Z 33 are the individual data 18c , ie the rolling forces F of all datasets 16 the size of the corresponding cell, ie sorted in ascending or descending order. In 3 this is already shown by the representation as histogram f 11 to f 33 , in 4 again explicitly shown. Between each two adjacent rolling forces F whose distances 26 determined. distances 26 , which are greater than a limit β σ loc are, be as a gap 28 identified. In the example, the value of the parameter β = 2 was chosen. records 16 with rolling forces F, which without a gap 28 related, become clusters or groups 30a , b summarized.

In 3 zeigt die Zelle Z12 eine Werteverteilung der Walzkräfte F der in der Zelle 12 liegenden Datensätze 16, welche durch die Lücke 28 in die zwei Gruppen 30a, b aufgeteilt sind. Die Zelle Z12 wird daher als "heterogene Zelle" deklariert.In 3 the cell Z 12 shows a value distribution of the rolling forces F in the cell 12 lying records 16 passing through the gap 28 into the two groups 30a , b are split. The cell Z 12 is therefore declared as a "heterogeneous cell".

Bei einer derartig heterogenen Zelle Z12 besteht der Verdacht, dass eine der Gruppen 30a oder 30b im Gegensatz zu den oben gefundenen Ausreißern bzw. Fehldaten 22 eine ganze Gruppe fehlerhafter Werte 18c darstellt.In such a heterogeneous cell Z 12, it is suspected that one of the groups 30a or 30b in contrast to the outliers or misinformation found above 22 a whole group of incorrect values 18c represents.

In einem, dem Schritt 40 entsprechenden Schritt 46 wird daher innerhalb der Zelle Z12, jedoch für jede Gruppe 30a und b getrennt, deren jeweiliger Mittelwert F 12a und F 12b der Walzkräfte F ermittelt, welche in 3 ebenfalls eingezeichnet sind.In one, the step 40 appropriate step 46 is therefore within cell Z 12 , but for each group 30a and b separately, their respective mean F 12a and F 12b the rolling forces F determines which in 3 are also shown.

Da nun mehrere, im Beispiel zwei, Mittelwerte in der Zelle Z12 vorhanden sind, kann keiner von diesen a priori als korrekter Mittelwert wie oben, angenommen werden. Daher muss der korrekte zu erwartende Zielwert, also Mittelwert, in der Zelle Z12 anderweitig abgeschätzt werden.Because now more, two in the example, average values in the cell Z 12 are available, none of them can a priori be the correct mean as above, be adopted. Therefore, the correct expected target value, ie average, in the cell Z 12 has to be estimated otherwise.

In einem Schätzschritt 48 wird daher ein empirisches Modell 32 des den Datensätzen 16 zugrunde liegenden Prozesses entworfen. Im vorliegenden Beispiel wird also versucht, das Walzwerk 2 insofern nachzubilden, dass bei gegebenen Werten von Breite b und Kohlenstoffgehalt c als Eingangsgrößen das Modell 32 die zu erwartende Walzkraft F als Ausgangsgröße liefert. Hierzu werden von den neun Zellen Z11 bis Z33 alle bis auf die zu untersuchende Zelle, im Beispiel die Zelle Z12, zur Modellierung verwendet. Das heißt, dass nur die Datensätze 16 der verbleibenden acht Zellen benutzt werden, um einen Schätzwert F S für die zu prüfende Zelle Z12 zu ermitteln. Das Modell 32 ist hierbei z.B. ein MLP oder JIT, wie oben erläutert.In an estimation step 48 becomes therefore an empirical model 32 of the records 16 the underlying process. In the present example, so the mill is trying 2 to the extent that given given values of width b and carbon content c as input variables the model 32 the expected rolling force F as output delivers. For this purpose, of the nine cells Z 11 to Z 33 all but the cell to be examined, in the example the cell Z 12 , are used for the modeling. That is, only the records 16 the remaining eight cells are used to give an estimate F S for the cell Z 12 to be tested. The model 32 Here, for example, is an MLP or JIT, as explained above.

Der im Schätzschritt 48 ermittelte Schätzwert F S ist in 3 eingezeichnet. Für alle, im Beispiel also beide, Gruppen 30a, b wird nun geprüft, welcher der Mittelwerte der Gruppen 30a, b, im Beispiel F 12a oder F 12b dem Schätzwert F S am nächsten kommt. In 3 ist dies der Mittelwert F 12a der Gruppe 30a. Dieser wird als gültig erachtet. Sämtlichen Datensätze 16 der verbleibenden Gruppen, im Beispiel der Gruppe 30b, werden daher als fehlerhaft markiert. Die Überprüfung auf den geringsten Abstand der Mittelwerte F 12a oder F 12b der Gruppen 30a, b zum Schätzwert F S stellt also in Schritt 48 das erfindungsgemäße Prüfkriterium dar. Natürlich ist auch der Weg dorthin, also das Sortieren der Datensätze 16 und das Auffinden der Lücken 28 in gewisser Weise dem Prüfkriterium zuzuordnen.The in the estimation step 48 estimated value F S is in 3 located. For all, in the example so both, groups 30a , b is now checked which of the means of the groups 30a , b, in the example F 12a or F 12b the estimated value F S comes closest. In 3 this is the mean F 12a the group 30a , This is considered valid. All records 16 the remaining groups, in the example of the group 30b , are therefore marked as faulty. The check for the smallest distance of the means F 12a or F 12b of the groups 30a , b for an estimate F S So put in step 48 the inventive Of course, the way is there, so the sorting of records 16 and finding the gaps 28 in a certain way to the test criterion.

Mit der Verfahrensvariante der Schritte 44 bis 48 können also auch gruppenweise fehlerhafte Datensätze 16, im Beispiel die Gruppe 30b von Datensätzen 16, identifiziert und als ungültig markiert und danach vom weiteren Verfahren ausgeschlossen werden.With the process variant of the steps 44 to 48 So also groups can be faulty records 16 , in the example the group 30b of records 16 , identified and marked as invalid and then excluded from further proceedings.

Mit der dritten Verfahrensvariante, welche sich in 4 an den Schätzschritt 48 anschließt, werden dann noch Datensätze gesucht, die innerhalb einer Zelle als geschlossene Gruppe ohne Lücke 28 in ihrer Gesamtheit fehlerhaft sind. Dies ist in 3 für die Zelle Z13 gezeigt.With the third process variant, which is in 4 to the estimation step 48 Then, records are searched that are within a cell as a closed group with no gap 28 are flawed in their entirety. This is in 3 for the cell Z 13 shown.

Im Schritt 50 werden entsprechend dem Schritt 40 wiederum die Mittelwerte F 11 bis F 33 für sämtliche Zellen Z11 bis Z33 bestimmt. Da jedoch, wie im vorliegenden Beispiel inzwischen etliche Datensätze als fehlerhaft ausgeschlossen wurden, ergeben sich hierbei andere Zahlenwerte für die Mittelwerte F 11 bis F 33 im Schritt 50. Dann wird nochmals ein Schätzschritt 52 entsprechend dem Schätzschritt 48, jedoch ebenfalls auf der veränderten Datenbasis ausgeführt, so dass für jede der Zellen Z11 bis Z33 auch ein entsprechender Schätzwert F 11s bis F 33s ermittelt wird. Dies erfolgt wieder wahlweise am gleichen oder geänderten empirischen Modell 32 wie in Schritt 48, indem für jeden der Schätzwerte F 11s bis F 33s die entsprechende Zelle Z11 bis Z33 ausgeschlossen wird.In step 50 be according to the step 40 again the mean values F 11 to F 33 determined for all cells Z 11 to Z 33 . However, since, as in the present example, a number of data records have now been excluded as faulty, other numerical values for the mean values result here F 11 to F 33 in step 50 , Then again an estimation step 52 according to the estimation step 48 , However, also be carried out on the modified data base so that for each of the cells Z 11 to Z 33, a corresponding estimated value F 11s to F 33s is determined. This is again done optionally on the same or changed empirical model 32 as in step 48 by looking for each of the estimates F 11s to F 33s the corresponding cell Z 11 to Z 33 is excluded.

Anschließend wird im Prüfschritt 54 für jede der Zellen Z11 bis Z33 geprüft, ob deren Mittelwert F 11 bis F 33 um mehr als γ1 σ loc vom entsprechenden Schätzwert F 11s bis F 33s abweicht. Anstelle der lokalen Streuung σ loc kann hier alternativ auch die globale Streuung verwendet werden. Die Prüfbedingung, also das Prüfkriterium lautet dann, ob die Abweichung kleiner γ2 σglob ist. Im Beispiel wurde die Werte γ11 = 3 bzw. γ22 = 0,2 gewählt.Subsequently, in the test step 54 for each of the cells Z 11 to Z 33 checked whether their mean F 11 to F 33 more than γ 1 σ loc from the corresponding estimate F 11s to F 33s differs. Instead of local dispersion σ loc Alternatively, the global dispersion can be used here as well. The test condition, ie the test criterion, is then whether the deviation is smaller than γ 2 σ glob . In the example, the values γ 1 1 = 3 and γ 2 2 = 0.2 were chosen.

In Schritt 54 wird also entsprechend dem Schritt 42 ein Prüfkriterium anhand der mit einem Faktor gewichteten lokalen σ loc oder globalen σglob Streuung verwendet.In step 54 So it will be according to the step 42 a test criterion based on the factor-weighted local σ loc or global σ glob scattering used.

Entsprechend gefundene Datensätze werden wieder als ungültig markiert. In 3 wird im Verfahrensabschnitt 50 bis 54 für die Zelle Z13 erkannt, dass deren einzige Gruppe 34 von Datensätzen 16 mit ihrem errechneten Mittelwert F 13 um mehr als 0,2σglob vom aus den restlichen acht Zellen Z11 bis Z33 (ohne Z13) geschätzten Mittelwert F 13s abweicht. Alle Datensätze 16 der Zelle Z13 werden daher als ungültig markiert.Correspondingly found records are again marked as invalid. In 3 is in the procedure section 50 to 54 for the cell Z 13 it is recognized that its only group 34 of records 16 with their calculated mean F 13 by more than 0,2σ glob of the mean value estimated from the remaining eight cells Z 11 to Z 33 (without Z 13 ) F 13s differs. All records 16 the cell Z 13 are therefore marked as invalid.

Claims (14)

Verfahren zum Auffinden eines fehlerhaften Datensatzes (22, 30b, 34) in einer Datensatzmenge (M), wobei jeder Datensatz (16) eine Anzahl (N) Eingangsdaten (18a, b) und mindestens ein mit diesen korreliertes Zieldatum (18c) umfasst, und wobei jedes Eingangsdatum (18a, b) nur Werte innerhalb eines Wertebereiches (Wn) annimmt und dadurch die Eingangsdaten (18a, b) einen Eingangsdatenraum (20) aufspannen, mit folgenden Schritten: – mindestens einer der Wertebereiche (Wn) wird in Intervalle (Ik,n) unterteilt, wodurch sich im Eingangsdatenraum (20) N-dimensionale Zellen (Z) mit den Intervallen (Ik,n) als Kantenlängen bilden, – mindestens eine Zelle (Z) wird als zu prüfende Zelle (Z) ausgewählt, – aus den Werten (F) der Zieldaten (18c) der Datensätze (16) wird ein Prüfkriterium (42, 44, 48) für die Zieldaten (18c) der Datensätze (16) der ausgewählten Zelle (Z) ermittelt, – jeder Datensatz (16) der ausgewählten Zelle (Z), dessen Wert (F) des Zieldatums (18c) das Prüfkriterium (42, 44, 48) verfehlt, wird als fehlerhaft gekennzeichnet.Method for finding a faulty data record ( 22 . 30b . 34 ) in a set of records (M), each record ( 16 ) a number (N) of input data ( 18a , b) and at least one target date correlated therewith ( 18c ), and each input date ( 18a , b) assumes only values within a value range (W n ) and thereby the input data ( 18a , b) an input data space ( 20 ), comprising the following steps: - at least one of the value ranges (W n ) is subdivided into intervals (I k, n ), whereby in the input data space ( 20 ) Form N-dimensional cells (Z) with the intervals (I k, n ) as edge lengths, - at least one cell (Z) is selected as cell to be tested (Z), - from the values (F) of the target data ( 18c ) of the data records ( 16 ) becomes a test criterion ( 42 . 44 . 48 ) for the target data ( 18c ) of the data records ( 16 ) of the selected cell (Z), - each data record ( 16 ) of the selected cell (Z) whose value (F) of the target date ( 18c ) the test criterion ( 42 . 44 . 48 ) misses, is marked as faulty. Verfahren nach Anspruch 1, bei dem die Intervalle (Ik,n) für ein Eingangsdatum (18a, b) durch äquidistante Teilung dessen Wertebereiches (Wn) in eine vorgebbare Anzahl von Intervallen (Ik,n) gebildet werden.Method according to Claim 1, in which the intervals (I k, n ) for an input date ( 18a , b) by equidistant division of its range of values (W n ) are formed in a predetermined number of intervals (I k, n ). Verfahren nach Anspruch 1, bei dem die Intervalle (Ik,n) für ein Eingangsdatum (18a, b) unter Nutzung von Vorwissen über die Eingangs- (18a, b) und/oder Zieldaten (18c) durch manuell konfigurierbare Teilung dessen Wertebereiches (Wn) gebildet werden.Method according to Claim 1, in which the intervals (I k, n ) for an input date ( 18a (b) using prior knowledge of the input ( 18a , b) and / or target data ( 18c ) are formed by manually configurable division of its value range (W n ). Verfahren nach einem der vorhergehenden Ansprüche, bei dem als Prüfkriterium (42, 44, 48) ein Toleranzbereich (F ± σ) für den Wert (F) des Zieldatums (18c) ermittelt wird.Method according to one of the preceding claims, in which the test criterion ( 42 . 44 . 48 ) a tolerance range ( F ± σ) for the value (F) of the target date ( 18c ) is determined. Verfahren nach Anspruch 4, bei dem das Prüfkriterium (42, 44, 48) durch statistische Methoden aus Werten (F) der Zieldaten (18c) ermittelt werden.Method according to Claim 4, in which the test criterion ( 42 . 44 . 48 ) by statistical methods of values (F) of the target data ( 18c ) be determined. Verfahren nach Anspruch 4 oder 5, bei dem als Sollwert (F) der Mittelwert der Zieldaten (18c) der Datensätze (16) der ausgewählten Zelle (Z) ermittelt wird.Method according to Claim 4 or 5, in which the setpoint value is ( F ) the mean value of the target data ( 18c ) of the data records ( 16 ) of the selected cell (Z) is determined. Verfahren einem der Ansprüche 4 bis 6, bei dem der Toleranzbereich (F ± σ) durch Gewichtung (α, β, γ1, γ2) mit der Standardabweichung der entsprechenden Zieldaten (18c) der ausgewählten Zelle (Z) ermittelt wird.Method according to one of claims 4 to 6, wherein the tolerance range ( F ± σ) by weighting (α, β, γ 1 , γ 2 ) with the standard deviation of the corresponding target data ( 18c ) of the selected cell (Z) is determined. Verfahren nach einem der Ansprüche 4 bis 6, bei dem der Toleranzbereich (σ) durch Gewichtung (α, β, γ1) mit der über alle Zellen (Z) gemittelten Standardabweichung der entsprechenden Zieldaten (18c) ermittelt wird.Method according to one of claims 4 to 6, in which the tolerance range (σ) is determined by weighting (α, β, γ 1 ) with the standard deviation of the corresponding target data averaged over all cells (Z) ( 18c ) is determined. Verfahren nach einem der Ansprüche 4 bis 8, bei dem: – die globale Streuung (σg) des Zielwertes für alle Datensätze (16) ermittelt wird, – der Toleranzbereich durch Gewichtung (γ2) der globalen Streuung (σg) ermittelt wird.Method according to one of Claims 4 to 8, in which: the global dispersion (σ g ) of the target value for all data sets ( 16 ), - the tolerance range is determined by weighting (γ 2 ) of the global dispersion (σ g ). Verfahren nach einem der vorhergehenden Ansprüche, bei dem: – ein empirisches Modell (32) zur Abbildung der Eingangsdaten (18a, b) auf die Zieldaten (18c) erstellt wird, – das Zielkriterium (48, 54) für die ausgewählte Zelle (Z) mit dem empirischen Modell (32) ermittelt wird.Method according to one of the preceding claims, in which: an empirical model ( 32 ) for mapping the input data ( 18a , b) the target data ( 18c ), - the target criterion ( 48 . 54 ) for the selected cell (Z) with the empirical model ( 32 ) is determined. Verfahren nach einem der vorhergehenden Ansprüche, bei dem – das Zielkriterium (42, 44, 48) auf Basis aller oder einer Teilmenge aller Zellen (Z), außer der zu untersuchenden Zelle (Z) ermittelt wird.Method according to one of the preceding claims, in which - the target criterion ( 42 . 44 . 48 ) is determined on the basis of all or a subset of all cells (Z), except for the cell (Z) to be examined. Verfahren nach einem der vorhergehenden Ansprüche, bei dem – die Zielwerte (18c) der ausgewählten Zelle (Z) nach ihrer Größe sortiert werden, – die Differenzen (26) je zweier benachbarten Zielwerte (18c) ermittelt werden, – Differenzen (26), die größer einem Lückengrenzwert sind, als Lücke (28) definiert werden, – Datensätze (16) mit Zielwerten (18c), die ohne Lücke (28) aneinandergrenzen, zu Clustern (30a, b) zusammengefasst werden, – Datensätze (16) eines Clusters (30a, b) in Abhängigkeit des Prüfkriteriums (42, 44, 48) gemeinsam als fehlerhaft oder nicht fehlerhaft gekennzeichnet werden.Method according to one of the preceding claims, in which - the target values ( 18c ) of the selected cell (Z) are sorted according to their size, - the differences ( 26 ) each two adjacent target values ( 18c ), - differences ( 26 ), which are greater than a gap limit, as a gap ( 28 ), - records ( 16 ) with target values ( 18c ), without gap ( 28 ), to clusters ( 30a , b) summarized, - datasets ( 16 ) of a cluster ( 30a , b) depending on the test criterion ( 42 . 44 . 48 ) together as faulty or not faulty. Verfahren nach Anspruch 12, bei dem für jeden Cluster (30a, b) der Mittelwert der zugehörigen Zielwerte (18c) ermittelt und mit dem Prüfkriterium (42, 44, 48) geprüft wird.The method of claim 12, wherein for each cluster ( 30a , b) the mean of the associated target values ( 18c ) and with the test criterion ( 42 . 44 . 48 ) is checked. Verfahren nach einem der Ansprüche 12 oder 13, bei dem das Prüfkriterium (42, 44, 48) so ermittelt wird, dass alle Datensätze (16) einer Zelle (Z) außer des dem Prüfkriterium (42, 44, 48) am nächsten kommenden Datensatzes (18) oder Clusters (34) als fehlerhaft gekennzeichnet werden.Method according to one of Claims 12 or 13, in which the test criterion ( 42 . 44 . 48 ) is determined so that all data records ( 16 ) of a cell (Z) other than the test criterion ( 42 . 44 . 48 ) at the next record ( 18 ) or clusters ( 34 ) are marked as faulty.
DE200610003611 2006-01-25 2006-01-25 Method for finding a faulty record in a set of records Withdrawn DE102006003611A1 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE200610003611 DE102006003611A1 (en) 2006-01-25 2006-01-25 Method for finding a faulty record in a set of records
RU2008134475/09A RU2008134475A (en) 2006-01-25 2007-01-03 METHOD FOR FINDING ERRORS WHEN OPERATING AN INSTALLATION CONTAINING MANY DATASETS
EP07703593A EP1977319A2 (en) 2006-01-25 2007-01-03 Method for the detection of a fault during operation of a system comprising a certain number of data records
PCT/EP2007/050018 WO2007085504A2 (en) 2006-01-25 2007-01-03 Method for the detection of a fault during operation of a system comprising a certain number of data records
CNA2007800035403A CN101375254A (en) 2006-01-25 2007-01-03 Error found method when running device with datagroup collection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200610003611 DE102006003611A1 (en) 2006-01-25 2006-01-25 Method for finding a faulty record in a set of records

Publications (1)

Publication Number Publication Date
DE102006003611A1 true DE102006003611A1 (en) 2007-08-02

Family

ID=38268113

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200610003611 Withdrawn DE102006003611A1 (en) 2006-01-25 2006-01-25 Method for finding a faulty record in a set of records

Country Status (5)

Country Link
EP (1) EP1977319A2 (en)
CN (1) CN101375254A (en)
DE (1) DE102006003611A1 (en)
RU (1) RU2008134475A (en)
WO (1) WO2007085504A2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017007971A1 (en) 2017-08-23 2018-04-19 Daimler Ag Method for producing a test template
DE102022107820A1 (en) 2022-04-01 2023-10-05 Volkswagen Aktiengesellschaft Method and processor circuit for checking the plausibility of a detection result of object recognition in an artificial neural network and motor vehicle

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101325638B1 (en) * 2011-09-09 2013-11-07 비앤에프테크놀로지 주식회사 Method measuring of healthy indicia of plant reflected status of sub-component and storage media thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19514535A1 (en) * 1995-04-20 1996-10-31 Johannes Prof Dr Wortberg Process control using mathematical model for resultant product properties
EP0762245A1 (en) * 1995-08-16 1997-03-12 Thomas Froese Method for detecting a faulty prediction in a neural process control
DE19644131A1 (en) * 1996-10-23 1998-04-30 Siemens Ag Method of optimising strip width control at the ends of a strip on a rolling line,

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073089A (en) * 1997-10-22 2000-06-06 Baker; Michelle Systems and methods for adaptive profiling, fault detection, and alert generation in a changing environment which is measurable by at least two different measures of state
AU2002329611A1 (en) * 2001-07-20 2003-03-03 Altaworks Corporation System and method for adaptive threshold determination for performance metrics
US20030065409A1 (en) * 2001-09-28 2003-04-03 Raeth Peter G. Adaptively detecting an event of interest
DE10203787A1 (en) * 2002-01-31 2003-08-14 Siemens Ag Process for regulating an industrial process

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19514535A1 (en) * 1995-04-20 1996-10-31 Johannes Prof Dr Wortberg Process control using mathematical model for resultant product properties
EP0762245A1 (en) * 1995-08-16 1997-03-12 Thomas Froese Method for detecting a faulty prediction in a neural process control
DE19644131A1 (en) * 1996-10-23 1998-04-30 Siemens Ag Method of optimising strip width control at the ends of a strip on a rolling line,

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017007971A1 (en) 2017-08-23 2018-04-19 Daimler Ag Method for producing a test template
DE102022107820A1 (en) 2022-04-01 2023-10-05 Volkswagen Aktiengesellschaft Method and processor circuit for checking the plausibility of a detection result of object recognition in an artificial neural network and motor vehicle

Also Published As

Publication number Publication date
CN101375254A (en) 2009-02-25
WO2007085504A3 (en) 2007-10-25
WO2007085504A2 (en) 2007-08-02
RU2008134475A (en) 2010-02-27
EP1977319A2 (en) 2008-10-08

Similar Documents

Publication Publication Date Title
DE69113164T2 (en) Method and device for controlling a process.
DE102017211737B4 (en) Monitoring device and method for monitoring a system
EP4196805B1 (en) Battery management system for classifying a battery module
WO2001002840A1 (en) Method and device for process-optimizing regulation of parameters in a production process
EP1397274B1 (en) Method for determining the time and extent of maintenance operations
WO2022063702A1 (en) Quality control for products produced in series
EP4165484B1 (en) Monitoring device and method for detection of abnormalities
DE69713600T2 (en) SYSTEM FOR MONITORING AND DIAGNOSIS OF AUTOMATIC CONTROL LOOPS
DE102018009309A1 (en) Numerical control unit
DE102014223810A1 (en) Method and assistance system for detecting a fault in a system
DE102016216945A1 (en) A method and apparatus for performing a function based on a model value of a data-based function model based on a model validity indication
EP4108411A2 (en) Method, system and computer program product for monitoring a forming process
EP3839843A1 (en) Method for optimizing a production of an industrial installation
EP4295202B1 (en) Method and system for measuring components and program
DE102022114579A1 (en) Industrial plant and process for plant operation and monitoring
DE102006003611A1 (en) Method for finding a faulty record in a set of records
AT413609B (en) METHOD AND APPARATUS FOR PRODUCTION LEVEL DIFFERENT CONNECTION OF DATA
EP3396477B1 (en) Method for determining rules for characterizing the normal operating state of a work process
EP3618981B1 (en) Roll-forming unit with sensor-roll-forming frame
DE102022211293A1 (en) Method for identifying anomalies and thus also actual processing positions of a web and for classifying these anomalies, system and computer program product
WO2022263458A1 (en) Monitoring the production of material boards, in particular engineered wood boards, in particular using a self-organizing map
DE102019214009B3 (en) Analysis of sensor measurement data from a robot or manipulator
EP2569763B1 (en) Method for the computer-assisted monitoring of the functional performance of a technical system
DE112021007553T5 (en) Apparatus for predicting machining dimensions, system for predicting machining dimensions, method for predicting machining dimensions and program
EP4060441A1 (en) Method and system for detecting anomalies during operation of a technical system

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20110802