DE10296704T5

DE10296704T5 - Fuzzy-Inferenznetzwerk zur Klassifizierung von hochdimensionalen Daten

Info

Publication number: DE10296704T5
Application number: DE10296704T
Authority: DE
Inventors: Narayan Moorpark Srinivasa; Swarup S. Thousand Oaks Medasani
Original assignee: HRL Laboratories LLC
Current assignee: HRL Laboratories LLC
Priority date: 2001-04-23
Filing date: 2002-04-23
Publication date: 2004-04-22
Also published as: WO2002086814A1; US20030018592A1; US6950813B2; JP2004532467A

Abstract

Ein verbessertes Verfahren zur Erzeugung eines online lernenden Fuzzy-Inferenznetzwerks für die Klassifizierung von Daten unter Verwendung eines online lernenden Fuzzy-Inferenznetzwerks, wobei das Fuzzy-Inferenznetzwerk trainiert ist, um eine Regelbasis von unscharfen Regeln zu erzeugen, wobei jede unscharfe Regel einem Klassenlabel zugeordnet ist und jede unscharfe Regel wenigstens eine einer Dimension der Daten entsprechende Zugehörigkeitsfunktion aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkeiten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszugehörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslösestärke bestimmt wird, wobei die Zugehörigkeitsfunktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu...

Description

Technisches Gebiet
Die vorliegende Erfindung betrifft im Allgemeinen Datenverarbeitungssysteme und Verfahren. Sie betrifft genauer die Erzeugung eines künstlichen, aus einem neuronalen Netzwerk erzeugten Fuzzy-Expertensystem, aus welchem ein genauer, kompakter, interpretierbarer und sinnvoller Satz von Regeln extrahiert werden kann.
Hintergrund
Klassifizierungsalgorithmen, welche auf Online-Lernen basieren, wie etwa künstliche neuronale Netzwerke, besitzen die Fähigkeit, Beziehungen zwischen Eingaben und ihren entsprechenden Klassifizierungslabeln in einer inkrementellen Art und Weise zu abstrahieren. Wenn mehrere Punkte der Eingabe/Ausgabe-Abbildung abgetastet werden, ist der Algorithmus in der Lage, Entscheidungsgrenzen zu erzeugen, welche die verschiedenen Klassen in nicht linearer Art und Weise trennen. Eine wichtige Klasse von Online-Lernalgorithmen basiert auf der adaptiven Resonanztheorie (ART). ART-basierte lernende Systeme sind in der Lage, sowohl binäre als auch analoge Eingaben online zu lernen und zu klassifizieren. In der Literatur kann man verschiedene Varianten von ART-Systemen finden, wie etwa Fuzzy-ARTMAP, PROBART und Gauss'sche ARTMAP. Diese Systeme sind in der Lage, online überwacht zu lernen. Der Hauptnachteil bei diesem Algorithmus ist ihre Empfindlichkeit gegenüber Rauschen in den Trainingsdaten, was zu der Erzeugung einer untragbar großen Anzahl von Regeln für eine Klassifizierung führt. Es wurden Anstrengungen unternommen, Methoden zu entwickeln, um die Empfindlichkeit gegenüber Rauschen zu minimieren und ebenso das Verhältnis zwi schen Vorhersagegenauigkeit zu der für eine Klassifizierung erforderlichen Anzahl von Regeln zu verbessern. Zusätzlich zu ihrer Rauschempfindlichkeit sind ART-basierte lernende Systeme einer Implementation in Hardware nicht zugänglich, da einige zusätzliche Schritte unternommen werden müssen, um Regeln zu extrahieren, welche in eine unscharfe Inferenzform gebracht werden können. Daher sind ART-basierte lernende Systeme im Allgemeinen als Software implementiert, was wesentlich langsamer ist als ein analoges Hardwaresystem wäre. Dies ist weiterhin mit der Tatsache verbunden, dass diese Algorithmen dazu neigen, eine große Anzahl von Klassifizierungsregeln zu erzeugen.
Eine weitere Klasse von online lernenden Algorithmen basiert auf der Extraktion von Wissen in der Form von unscharfen Regeln durch Einstellen der Parameter eines fuzzy-logischen Inferenznetzwerks. Traditionell bestehen Fuzzy-Systeme aus einem Satz von unscharfen Wenn-Dann-Regeln, welche basierend auf Wissen eines Domänenexperten abgeleitet sind. Schlussfolgerungen an der Ausgabe für eine neue Eingabe werden dann auf der Grundlage dieser Regeln unter Verwendung des Fuzzy-Inferenznetzwerks getroffen. Dieser Ansatz basiert jedoch auf einer heuristischen Beobachtung des Systems durch den Experten, um die geeigneten Regeln zu extrahieren. Um diesen Nachteil zu überwinden, bestehen verschiedene Ansätze, welche darauf abzielen, unscharfe Wenn-Dann-Regeln direkt von numerischen Daten abzuleiten, welche von dem System beobachtet werden. Hauptsächlich hängen diese Ansätze von einer Optimierung von Fuzzy-Systemparametern offline von numerischen Daten ab, um die unscharfen Regeln zu erhalten. Somit sind diese Systeme nicht in der Lage, inkrementell zu lernen.
Eine weitere Klasse von lernenden Systemen ist das Fuzzy-Inferenznetzwerk, von welchem ein Beispiel das selbstaufbauende Fuzzy-Inferenznetzwerk (SONFIN) darstellt. Das SONFIN ist in der Lage, eine Basis von unscharfen Regeln selbst-organisiert und online aus numerischen Daten abzuleiten. Da die SONFIN-Architektur auf Grundlage von Fuzzy-Inferenzsystemen aufgebaut ist, kann das Netzwerk auf Grundlage seiner Regelbasis zu jeder beliebigen gegebenen Zeit Schlussfolgerungen an jeden beliebigen Eingabedaten treffen. Dies macht das SONFIN zu einem attraktiven Netzwerk für viele Echtzeitanwendungen, bei welchen sich die Umgebung dynamisch verändert und somit besteht eine Notwendigkeit, Wissen von dem System in der Form von unscharfen Regeln zu abstrahieren. Das SONFIN arbeitet sehr gut für eine Klassifizierung/funktionelle Abbildung von niedrigdimensionalen Eingabedaten. Wenn jedoch die Dimensionen des Eingaberaums zunimmt (wie etwa dort, wo die Anzahl an Eingabemerkmalen 10 übersteigt), ist der Algorithmus aufgrund eines mit der Lernregel zusammenhängenden Problems für ein Lernen ineffektiv. Die Unfähigkeit, ein angemessenes Lernen durchzuführen, wandelt das SONFIN im Wesentlichen zu einem schlechten Clusteralgorithmus, was somit zu schlechten Lern- und Vorhersagefähigkeiten und ebenso zu einer größeren Anzahl von unscharfen Regeln führt.
In 1 ist ein Flussdiagramm bereitgestellt, welches den Betrieb des SONFIN zeigt. Ein Abschnitt des Flussdiagramms repräsentiert ein gattungsgemäßes Fuzzy-Inferenznetzwerk 100. Das SONFIN stellt die Anpassungen bereit, welche notwendig sind, um ein Online-Lernen bereitzustellen. In einem Eingabeschritt 102 wird dem Fuzzy-Inferenznetzwerk 100 ein N-dimensionales Eingabemuster bereitgestellt. Das Fuzzy-Inferenznetzwerk 100 berechnet dann die Zugehörigkeitswerte („Membership Values") für jede Eingabedimension für jede Regel in einem Zugehörigkeitswert-Berechnungsschritt 104. In einem Auslösestärke-Prüfschritt 106 wird die Auslösestärke („Firing Strength") der Regeln basierend auf der Eingabe bestimmt und überprüft, um zu bestimmen, ob sie eine vorbestimmte Schwelle übersteigt. Dann, wenn die Auslösestärke die Schwelle übersteigt, berechnet das Fuzzy-Inferenznetzwerk 100 normalisierte Regelstärken für die Regel in einem Normalisierungsschritt 108. Das Fuzzy-Inferenznetzwerk 100 berechnet dann in einem Defuzzifizierungsschritt 110 eine Ausgabe unter Verwendung von Schwerpunkt-Defuzzifizierung. Im stati schen Betrieb eines trainierten Netzwerks ist das Ergebnis des Defuzzifizierungsschritts 110 die Ausgabe des Fuzzy-Inferenznetzwerks 100. Bei dem SONFIN wird die Ausgabe des Fuzzy-Inferenznetzwerks 100 einem Rückwärtsausbreitungsalgorithmus (back-propagation Algorithm) bereitgestellt, bei welchem die Regelparameter in einem Rückwärtsausbreitungsschritt 112 aktualisiert werden. Es wird eine Überprüfung durchgeführt, um zu bestimmen, ob mehr Eingaben vorhanden sind und der Zyklus beginnt erneut. Dann, wenn die Auslösestärke der Regeln kleiner als die Schwelle war und wenn die Regel einem Fuzzy-Ähnlichkeitsmaß nicht genügt, wird in einem Regelerzeugungsschritt 114 eine neue Regel erzeugt mit neuen Zugehörigkeitsfunktionen entlang jeder Eingabedimension.
Obwohl SONFIN ein selbstorganisiertes und online lernendes System bereitstellt, weist es einen wesentlichen Nachteil auf, da seine Leistung von der Anzahl an Eingabedimensionen abhängt. Somit ist SONFIN für eine Online-Klassifizierung von hochdimensionalen Daten tatsächlich nutzlos, wie etwa jene, welche bei Anwendungen auftreten, wie etwa eine Fahrzeuginsassenerfassung, Wettervorhersage, sowie Börsenanalyse/Wirtschaftsvorhersage.
Es ist daher wünschenswert, ein selbstorganisiertes, online lernendes System bereitzustellen, dessen Leistung von der Anzahl von Eingabedimensionen unabhängig ist. Da ein solches System in der Lage wäre, sein erlerntes Wissen in der Form von unscharfen Regeln zu erklären, kann das System mit neuen Daten unter Verwendung jener Regeln ohne jegliche Verzögerung ausgewertet werden, was somit während eines Entwickelns eines lernenden Systems erhebliche Zeit und einen erheblichen Datensammlungsaufwand einspart. Ein weiterer Vorteil ist, dass dann, wenn ein Erhöhen der Anzahl von Eingabedimensionen die Anzahl von Merkmalen erhöhen würde, keine Notwendigkeit bestehen würde, die Parameter des Netzwerks zu bearbeiten und das System in seiner Lernfähigkeit keinen Nachteil aufweisen würde. Somit wäre das System robuster und flexibel für eine Bewertung unterschiedlicher Klassifikationsstrategien.
Verweise, welche in Bezug auf neuronale Netzwerke und ihre Verwendung bei einer Klassifizierung unter Einbeziehung hochdimensionaler Probleme von Interesse sind, umfassen die folgenden:

1. Juang, C.F., und Lin, C.T., "An On-Line Self-Constructing Neural Fuzzy Inference Network and its Application", IEEE Transactions on Fuzzy Systems, Bd.6, Nr.1, S.12-32, Februar 1998.
2. Carpenter, G.A., und Grossberg, S., "The ART of adaptive pattern recognition by a self-organizing neural network", Computer, Bd.21, S.77-88, 1988.
3. Carpenter, G.A., Grossberg, S., Markuzon, N., Reynolds, J.H., Rosen, D.B., "Fuzzy ARTMAP: A Neural Network Architecture for Incremental Supervised Learning of Analog Multidimensional Maps", IEEE Transactions on Neural Networks, Bd.3, Nr.5, S.698-712, September 1992.
4. Marriott S., und Harrison, R.F., "A modified fuzzy ARTMAP architecture for approximation of noisy mappings", Neural Networks, Bd.2, S.359-366, 1995.
5. Williamson, J.R., "Gaussian ARTMAP: A neural network for fast incremental learning of noisy multidimensional maps", Neural Networks, Bd.9, S.881-997, 1996.
6. Srinivasa, N., "Learning and generalization of Noisy Mappings Using a Modified PROBART Neural Network", IEEE Transactions on Signal Processing, Bd.45, Nr.10, S.2533-2550, Oktober 1997.
7. Lee, C.C., "Fuzzy Logic in control systems: Fuzzy logic controller – Part II", IEEE Transactions on Systems, Man and Cybernetics, Bd.15, S.419-435, März/April 1990.
8. Jang, J.S., "ANFIS: Adaptive-network-based fuzzy inference system", IEEE Transactions on Systems, Man and Cybernetics, Bd.23, S.665-685, Mai 1993.
9. Takagi, T. und Seguno, M, "Fuzzy identification of systems and its applications to modeling and control", IEEE Transactions on Systems, Man and Cybernetics, Bd.15, S.116-132, Jan.1985.
10. Wang, L.X., und Mendel, J.M., "Generating fuzzy rules by learning from examples", IEEE Transactions on Systems, Man and Cybernetics, Bd.22, Nr.6, S.1414-1427, Nov./Dez.1992.
11. Beyer, K., Goldstein, J., Ramakrishnan, R., und Shaft, U., "When is Nearest Neighbor Meaningful?", Proc. of Seventh International Conference on Database Theory, Jerusalem, Israel, 1999.

Abriss der Erfindung
Die vorliegende Endung stellt ein Verfahren und ein System zur Erzeugung eines online lernenden Inferenznetzwerks für die Klassifizierung von hochdimensionalen Daten unter Verwendung eines Online-Fuzzy-Inferenznetzwerks, welches dazu trainiert ist, eine Regelbasis zu erzeugen. Die durch die vorliegende Erfindung erzeugte Regelbasis kann entweder in einer Software, welche an einem Rechner für allgemeine oder spezielle Aufgaben betrieben wird, oder in Hardware verkörpert sein. Die vorliegende Erfindung scheidet die Abhängigkeit der Fuzzy-Folgerungsmaschine von der Anzahl von Dimensionen der Eingangsdaten.
Genauer stellt eine Ausführungsform der vorliegenden Erfindung ein Verfahren zur verbesserten Klassifizierung von hochdimensionalen Daten unter Verwendung eines online lernenden Fuzzy-Inferenznetzwerks bereit, bei welchem das Fuzzy-Inferenznetzwerk eine Regelbasis von unscharfen Regeln erzeugt, wobei jede unscharfe Regel einem Klassenlabel zugeordnet ist und jede unscharfe Regel wenigstens eine einer Dimension der Daten entsprechende Zugehörigkeitsfunktion aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkeiten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszugehörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslösestärke bestimmt wird, wobei die Zugehörigkeitsfunktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu bestimmen, und wobei die Auslösefrequenzzahl einer jeden unscharfen Regel gespeichert wird, wobei die Verbesserung umfasst:
Bestimmen, ob die Auslösestärke der unscharfen Regel mit der größten Auslösestärke eine vorbestimmte Schwelle übersteigt;
im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle übersteigt, Einstellen der unscharfen Regel auf Grundlage des Klassifizierungsfehlers; sowie
im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle nicht übersteigt, Bestimmen, ob die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, korrekt mit der bekannten Klassifizierungszugehörigkeit der Testdaten übereinstimmt;
in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wird, mit der bekannten Klassifizierungszugehörigkeit der Testdaten nicht korrekt übereinstimmt, Einstellen der unscharfen Regel auf Grundlage des Klassifizierungsfehlers wie in; sowie in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wird, mit der bekannten Klassifizierungszugehörigkeit der Testdaten korrekt übereinstimmt, Anwenden einer Lernregel, um die Zugehörigkeitsfunktionsparameter derart zu aktualisieren, dass der Klassifizierungsfehler für hochdimensionale Klassifizierungsaufgaben minimiert wird.
In einer weiteren Ausführungsform der vorliegenden Erfindung umfasst der Einstellschritt des Verfahrens für eine verbesserte Klassifizierung von hochdimen sionalen Daten unter Verwendung einer online lernenden Fuzzy-Folgerung ferner die Unterschritte:
Anwenden eines unscharfen Ähnlichkeitsmaßes, um die Zugehörigkeitsfunktion entlang einer jeden Dimension der Testdaten mit den Testdaten zu vergleichen;
Hinzufügen einer neuen Zugehörigkeitsfunktion entlang jener Dimensionen, bei welchen das unscharfen Ähnlichkeitsmaß nicht erfüllt ist;
Erzeugen einer neuen unscharfen Regel einschließlich der neuen Zugehörigkeitsfunktionen und jener Zugehörigkeitsfunktionen, welche das unscharfe Ähnlichkeitsmaß erfüllt haben; sowie
Hinzufügen der neuen Regel zu der Regelbasis.
In noch einer weiteren Ausführungsform der vorliegenden Erfindung umfasst der Einstellschritt des Verfahrens für eine verbesserte Klassifizierung von hochdimensionalen Daten unter Verwendung einer online lernenden Fuzzy-Folgerungnetzwerk ferner die Unterschritte:
Zuweisen eines Mittelwertes zu jeder neuen Zugehörigkeitsfunktion gleich dem Wert der Testdaten, entsprechend der Dimension entsprechend der jeweiligen neuen Zugehörigkeitsfunktion;
Inkrementieren der Auslösefrequenzzahl für die neue unscharfe Regel; sowie Zuweisen einer Klassifizierungszugehörigkeit zu der neuen unscharfen Regel, welche mit der Klassifizierungszugehörigkeit der Testdaten übereinstimmt, für welche die Regel ausgelöst wird.
Nicht einschränkende Beispiele von Zugehörigkeitsfunktionen, welche für die vorliegende Erfindung nützlich sind, umfassen Gauss'sche Zugehörigkeitsfunktionen, Dreiecks-Zugehörigkeitsfunktionen und trapezoide Zugehörigkeitsfunktionen. Bevorzugt werden jedoch Gauss'sche Zugehörigkeitsfunktionen verwendet.
In einer weiteren Ausführungsform des Verfahrens der vorliegenden Erfindung, und in welcher die Zugehörigkeitsfunktionen Gauss'sche Zugehörigkeitsfunktionen sind und die Zugehörigkeitsfunktionsparameter einer jeden Gauss'schen Zugehörigkeitsfunktion einen Mittelwert und eine Varianz umfassen und wobei die Lernregel den Mittelwert und die Varianz der Gauss'schen Zugehörigkeitsfunktionen der unscharfen Regel mit der größten Auslösestärke nach der folgenden Maßgabe aktualisiert:
wobei μ* den aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert,
σ* die aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert,
μ den nicht aktualisierten Mittelwert σ der Gauss'schen Zugehörigkeitsfunktion repräsentiert,
σ die nicht aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, |e| den Klassifizierungsfehler für die Gauss'sche Zugehörigkeitsfunktion repräsentiert,
x den speziellen Wert der Testdaten für die der Gauss'schen Zugehörigkeitsfunktion entsprechende Dimension repräsentiert, und f die Auslösefrequenz für die spezielle unscharfe Regel repräsentiert, auf welche die Lernregel angewendet wird.
In einer weiteren Ausführungsform des Verfahrens der vorliegenden Erfindung umfasst das Verfahren ferner ein Bereitstellen eines online lernenden Fuzzy-Inferenznetzwerks, wobei das Fuzzy-Inferenznetzwerk eine Regelbasis von unscharfen Regeln erzeugt, wobei jede unscharfe Regel einem Klassenlabel zu geordnet ist und jede unscharfe Regel wenigstens eine Zugehörigkeitsfunktion entsprechend einer Dimension der Daten aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkeiten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszugehörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslösestärke bestimmt wird, wobei die Zugehörigkeitsfunktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu bestimmen, und wobei die Auslösefrequenzzahl einer jeden unscharfen Regel gespeichert wird.
Das System der vorliegenden Erfindung stellt ein verbessertes Fuzzy-Inferenznetzwerk für eine Online-Klassifizierung von hochdimensionalen Daten bereit, bei welchem das Fuzzy-Inferenznetzwerk eine Regelbasis von unscharfen Regeln erzeugt, wobei jede unscharfe Regel einem Klassenlabel zugeordnet ist und jede unscharfe Regel wenigstens eine einer Dimension der Daten entsprechende Zugehörigkeitsfunktion aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkeiten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszugehörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslösestärke bestimmt wird, wobei die Zugehörigkeits funktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu bestimmen, und wobei die Auslösefrequenzzahl einer jeden unscharfen Regel gespeichert wird, wobei die Verbesserung einen Regeleinstell- und Lernregelanwendungsprozessor umfasst, welcher mit dem Fuzzy-Inferenznetzwerk verbunden ist, um die unscharfen Regeln; den Klassifizierungsfehler; die Auslösestärke, die Auslösefrequenzzahl und die durch die unscharfe Regel mit der größten Auslösestärke erzeugte Klassifizierungszugehörigkeit; die Testdaten und die bekannten Klassifizierungszugehörigkeiten für die Testdaten zu erhalten; wobei der Prozessor derart arbeitet, dass er bestimmt, ob die Auslösestärke der unscharfen Regel mit der größten Auslösestärke eine vorbestimmte Schwelle übersteigt; sowie
dass er im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle übersteigt, die unscharfe Regel auf Grundlage des Klassifizierungsfehlers einstellt; sowie
dass er im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle nicht übersteigt, bestimmt, ob die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wird, korrekt mit der bekannten Klassifizierungszugehörigkeit der Testdaten übereinstimmt;
in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wird, mit der bekannten Klassifizierungszugehörigkeit der Testdaten nicht korrekt übereinstimmt, dass er die unscharfe Regel auf Grundlage des Klassifizierungsfehlers einstellt; sowie
in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, mit der bekannten Klassifizierungszugehörigkeit der Testdaten korrekt übereinstimmt, dass er eine Lernregel anwendet, um die Zugehörigkeitsfunktionsparameter derart zu aktualisieren, dass der Klassifizierungsfehler für hochdimensionale Klassifizierungsaufgaben minimiert wird.
In einer weiteren Ausführungsform arbeitet das System der vorliegenden Erfindung, der Regeleinstell- und Lernregelanwendungsprozessor ferner derart, dass er:
ein unscharfes Ähnlichkeitsmaß anwendet, um die Zugehörigkeitsfunktion entlang einer jeden Dimension der Testdaten mit den Testdaten zu vergleichen;
eine neue Zugehörigkeitsfunktion entlang jener Dimensionen hinzufügt, bei welchen das unscharfe Ähnlichkeitsmaß nicht erfüllt ist;
eine neue unscharfe Regel einschließlich der neuen Zugehörigkeitsfunktionen und jener Zugehörigkeitsfunktionen erzeugt, welche das unscharfe Ähnlichkeitsmaß erfüllt haben; sowie
die neue Regel zu der Regelbasis hinzufügt.
In einer weiteren Ausführungsform des Systems der vorliegenden Erfindung arbeitet der Regeleinstell- und Lernregelanwendungsprozessor derart, dass er:
einer jeden neuen Zugehörigkeitsfunktion einen Mittelwert gleich dem Wert der Testdaten zuweist, entsprechend der Dimension entsprechend der jeweiligen neuen Zugehörigkeitsfunktion;
die Auslösefrequenzzahl für eine neue unscharfe Regel inkrementiert; sowie der neuen unscharfen Regel eine Klassifizierungszugehörigkeit zuweist, welche mit der Klassifizierungszugehörigkeit der Testdaten übereinstimmt, für welche die Regel ausgelöst wird.
In einer weiteren Ausführungsform des Systems der vorliegenden Erfindung sind die Zugehörigkeitsfunktionen Gauss'sche Zugehörigkeitsfunktionen und umfassen die Zugehörigkeitsfunktionsparameter einer jeder Gauss'schen Zugehörigkeitsfunktion einen Mittelwert und eine Varianz, wobei die angewendete Lernregel den Mittelwert und die Varianz der Gauss'schen Zugehörigkeitsfunktionen der unscharfen Regel mit der größten Auslösestärke nach der folgenden Maßgabe aktualisiert:

wobei μ* den aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert,
σ* die aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert,
μ den nicht aktualisierten Mittelwert σ der Gauss'schen Zugehörigkeitsfunktion repräsentiert,
σ die nicht aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, |e| den Klassifizierungsfehler für die Gauss'sche Zugehörigkeitsfunktion repräsentiert,
x den speziellen Wert der Testdaten für die der Gauss'schen Zugehörigkeitsfunktion entsprechende Dimension repräsentiert, und f die Auslösefrequenz für die spezielle unscharfe Regel repräsentiert, auf welche die Lernregel angewendet wird.
In einer weiteren Ausführungsform der vorliegenden Erfindung umfasst das System ferner ein online lernendes Fuzzy-Inferenznetzwerk, wobei das Fuzzy-Inferenznetzwerk eine Regelbasis von unscharfen Regeln erzeugt, wobei jede unscharfe Regel einem Klassenlabel zugeordnet ist und jede unscharfe Regel wenigstens eine Zugehörigkeitsfunktion entsprechend einer Dimension der Daten aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkeiten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszugehörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslö sestärke bestimmt wird, wobei die Zugehörigkeitsfunktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu bestimmen, und wobei die Auslösefrequenzzahl einer jeden unscharfen Regel gespeichert wird.
Die vorliegende Erfindung umfasst ferner eine Regelbasis, welche entweder durch das Verfahren oder das System der vorliegenden Erfindung erzeugt wird.
Kurze Beschreibung der Zeichnungen
Die Erfindung wird nun durch beispielhafte Ausführungsformen mit Bezug auf die beiliegenden vereinfachten, diagrammartigen Zeichnungen beschrieben. In den Zeichnungen ist:
1 ein Flussdiagramm, welches den Betrieb des SONFIN darstellt;
2 ein Knotendiagramm, welches ein fünflagiges neuronales Netzwerk zeigt, mit welchem die vorliegende Erfindung genutzt werden kann;
3 ein Blockdiagramm, welches die Komponenten der vorliegenden Erfindung zusätzlich zu einem online lernenden Fuzzy-Inferenznetzwerk, wie etwa dem SONFIN, zeigt;
4 ein Flussdiagramm, welches die Schritte in dem Verfahren der vorliegenden Erfindung demonstriert, sowie
5 eine Tabelle, welche einen Leistungsvergleich einer Ausführungsform der vorliegenden Erfindung mit dem SONFIN- und dem M-PROBART-Netzwerk zeigt.
Beschreibung
Die vorliegende Endung betrifft Expertensysteme und insbesondere Online-Fuzzy-Inferenzsysteme, welche an eine Verarbeitung hochdimensionaler Klassifizierungsprobleme angepasst sind. Die folgende Beschreibung wird vorge stellt, um einen Durchschnittsfachmann in die Lage zu versetzen, die Erfindung zu schaffen und zu verwenden, und sie im Zusammenhang mit besonderen Anwendungen zu integrieren. Verschiedene Modifikationen der bevorzugten Ausführungsform, ebenso wie eine Vielfalt von Verwendungen in verschiedenen Anwendungen wird Fachleuten in einfacher Weise offensichtlich sein und die hier definierten allgemeinen Prinzipien können auf andere Ausführungsformen angewendet werden. Somit ist nicht beabsichtigt, dass die vorliegende Erfindung auf die gezeigten Ausführungsformen beschränkt sein soll. Vielmehr soll sie den breitesten Rahmen gewähren, welcher mit den hier offenbarten Prinzipien und neuen Merkmalen übereinstimmt.
Glossar
Die folgenden Ausdrücke werden definiert, um den Leser darin zu unterstützen, ein vollständigeres Verständnis der in dieser Beschreibung verwendeten Terminologie zu gewinnen:
Aktivierungsfunktion
Die Aktivierungsfunktion ist eine Funktion, welche ein Verhalten des Knotens oder einer Lage von Knoten repräsentiert, welches einer bestimmten Eingabe gestattet, den Knoten oder Knoten auszulösen, um zu bewirken, dass sich das Signal zu der nächsten Lage hin ausbreitet.
Auslösefrequenzzahl
Jedes mal, wenn eine Regel ausgelöst wird, wird ein Zähler inkrementiert. Dies stellt ein Maß der Frequenz bereit, mit welcher die Regel verwendet worden ist. Die Auslösefrequenz kann einfach jedes mal inkrementiert werden, wenn eine Regel ausgelöst wird, oder sie kann lediglich dann inkrementieren, wenn eine Regel mit einer Auslösestärke ausgelöst wird, welche eine bestimmte Schwelle übersteigt.
Auslösestärke
Jedes mal, wenn eine Regel verwendet wird, um mit dem Testdaten übereinzustimmen, wird sie als "ausgelöst" betrachtet. Die Auslösestärke ist ein Maß, wie stark die Regel auf die Testdaten reagiert, und wird durch die Koeffizienten der Regel bestimmt.
Hochdimensionale Daten
Zu Zwecken der vorliegenden Erfindung beziehen sich hochdimensionale Daten im Allgemeinen auf Daten, für welche die Anzahl an Eingaben 10 übersteigt.
Lernen/Trainieren
Die vorliegende Erfindung ermöglicht, dass eine Regelbasis für eine Fuzzy-Folgerungsmaschine inkrementell durch Online-Lernen entwickelt wird (im Gegensatz zu Stapellernen, bei welchem alles Lernen in einer Prozedur erreicht wird). Die Regelbasis kann dann in Software zum Ablauf an einem Computer oder in Hardware verkörpert sein.
Zugehörigkeitsfunktion
Die Zugehörigkeitsfunktionen sind Verteilungsfunktionen, welche eine unscharfe Zugehörigkeit akkomodieren, deren nicht beschränkende Beispiel Gauss'sche, dreieckige und trapezoide Zugehörigkeitsfunktionen umfassen. Gauss'sche Zugehörigkeitsfunktionen werden für die vorliegende Erfindung als bevorzugte Zugehörigkeitsfunktionen betrachtet.
Zugehörigkeitsfunktionsparameter
Die Zugehörigkeitsfunktionen weisen Parameter auf, wie etwa im Falle von Gauss'schen Zugehörigkeitsfunktionen einen Mittelwert und eine Varianz, welche die Gestalt der Zugehörigkeitsfunktion und somit ihre Antwort auf eine Eingabe definieren. Diese Zugehörigkeitsfunktionen können iterativ angepasst oder in Abhängigkeit von ihrer Übereinstimmung mit den Eingabedaten und ihrer sich daraus ergebenden Nützlichkeit zur Datenklassifizierung ersetzt werden.
Prozessor
Die vorliegende Erfindung kann als Software an einem Allzweckrechner oder einem Rechner für besondere Aufgaben ausgeführt sein und ist ebenso anpassbar auf Ausführungsformen in Hardware.
Einführung
Derzeitige Fuzzy-Inferenznetzwerke, welche zum Online-Lernen verwendet werden, sind auf eine Verwendung in der Klassifizierung von niedrigdimensionalen Daten beschränkt. Die vorliegende Erfindung dehnt die Fähigkeit von derzeitigen Fuzzy-Inferenznetzwerken aus, um eine Klassifizierung von hochdimensionalen Daten zu erleichtern. Da der Klassifizierungsprozess von dem Vielfachen einer zunehmenden Zahl von Werten zwischen 0 und 1 abhängt, wird bei derzeitigen Fuzzy-Inferenznetzwerken das Gesamtvielfache zunehmend schmal, was schließlich zu Zahlen führt, die zu klein sind, um rechnerisch praktisch zu sein. Eine Aufgabe der vorliegenden Erfindung ist es, die Abhängigkeit eines Betriebs des Fuzzy-Inferenznetzwerks von der Anzahl an Dimensionen in den klassifizierten Daten zu trennen. Zu diesem Zweck werden zwei Operationen verwendet: Einstellen der unscharfen Regeln auf Grundlage des Klassifizierungsfehlers; sowie Anwenden einer Lernregel, um die Zugehörigkeitsfunktionsparameter zu aktualisieren.
Fuzzy-Inferenznetzwerke
Das sich selbst errichtende Fuzzy-Inferenznetzwerk (SONFIN) ist ein Beispiel eines online lernenden Fuzzy-Inferenznetzwerks, an welchem die vorliegende Erfindung angewendet werden kann. Ein Knotendiagramm eines fünflagigen neuronalen Netzwerks, durch das SONFIN beispielhaft gezeigt, ist in 2 dargestellt. Die folgende Beschreibung des SONFIN ist dazu gedacht, einen Rahmen bereitzustellen, innerhalb dessen die vorliegende Erfindung besser verstanden werden kann, sowie ein Beispiel eines Fuzzy-Inferenznetzwerks bereitzustellen, an welchem die vorliegende Erfindung angewendet werden kann.
Das SONFIN kann als ein fünflagiges Netzwerk ausgeführt sein, umfassend eine Mehrzahl von Knoten, wobei jeder Knoten innerhalb einer Lage eine Integrationsfunktion aufweist, welche die Information oder Evidenz von anderen Kno ten kombiniert. Die Integrationsfunktion bei jedem Knoten liefert die Netzeingabe an jedem Knoten wie folgt:
wobei u₁ ^(k), u₂ ^(k), ... u_p ^(k) die Eingaben zu dem Knoten und w₁ ^(k), w₂ ^(k), ..., w_p ^(k) die zugeordneten Verbindungsgewichtungen sind. Die Hochzahl k in der obigen Gleichung repräsentiert die Nummer der Lage. Gemeinsam mit der Integrationsfunktion f besitzt jeder Knoten eine Aktivierungsfunktion a(), welche für Lage 1 200 ergibt:
Was die Knotenausgabe als eine Funktion der Knoteneingabe über die Aktivierungsfunktion a() repräsentiert.
Lagenbeschreibungen
Jede der Lagen in dem SONFIN wird nun als Ausdruck ihrer Funktion in Bezug auf das Gesamtnetzwerk beschrieben.
Lage 1 200
Jeder Knoten in der Lage 1 200 entspricht einer Eingabevariablen. Die erste Lage führt keine Berechnung aus und überträgt einfach die Eingabewerte zu der zweiten Lage. Die Verbindungsgewichtungen in der ersten Lage sind alle gleich 1 gesetzt. Die Aktivierungsfunktion in diesem Fall ist die gleiche wie die Integrationsfunktion:
Lage 2 202
Das SONFIN versucht, neuronale und unscharfe Ansätze zu kombinieren, um neuronale Netzwerke zu trainieren. Die Verwendung von Fuzzy-Verfahren hilft, eine Interpretierbarkeit der durch das trainierte Netzwerk erzeugten Regeln bereitzustellen. Um eine sprachliche Interpretation des Netzwerks unterzubringen, setzt die Lage 2 202 das sprachliche Label (z.B. klein, groß, niedrig, hoch, usw.) mit den Eingangsvariablen in Beziehung. Sprachliche Label, welche den Eingabevariablen entsprechen, können durch die Verwendung von Abbildungsfunktionen (z.B. eine multidimensionale Gauss'sche Funktion) ermittelt werden. Diese den sprachlichen Label entsprechenden Parameter werden während der Trainingsphase erlernt. Für jede Eingabevariable kann die Zugehörigkeit in jedem sprachlichen Label in einfacher Weise erhalten werden. Die bei Lage 2 202 durchgeführte Funktion lautet wie folgt:
wobei m_ij und σ_ij den Mittelwert und die Varianz der Gauss'schen Zugehörigkeitsfunktion entsprechend jedem der sprachlichen Ausdrücke repräsentierten.
Lage 3 204
Ein Knoten in Lage 3 204 repräsentiert eine fuzzylogische Regel und führt eine Voraussetzungsabstimmung einer Regel aus. Die Verbindungsgewichtungen in dieser Lage sind 1. Die Verbindungen in dieser Lage bestimmen, welche sprachlichen Ausdrücke der Eingabevariablen für eine Regel relevant sind. Die folgende UND-Operation wird bei jedem Knoten in Lage 3 204 verwendet:
wobei D₁ = diag (1/σ_i1, 1//σ_i2, ..., 1/σ_ln), mi = (m_i1, m_i2, ..., m_in) und x das ndimensionale Eingabemuster repräsentiert. Die Ausgaben der Knoten in Lage 3 204 repräsentieren die Auslösestärken der entsprechenden unscharfen Regeln.
Lage 4 206
Wie in Lage 3 204 sind die Verbindungsgewichtungen in dieser Lage gleich 1. Die Anzahl an Knoten in Lage 4 206 ist gleich der Anzahl an Knoten in Lage 3 204. Die in Lage 3 204 berechneten Auslösestärken werden in Lage 4 206 durch die folgende Operation normalisiert:
Lage 5 208
Sobald die normalisierten Regel-Auslösestärken erhalten sind, müssen sie miteinander kombiniert werden, um eine Klassifizierungsentscheidung zu erzeugen. Im SONFIN werden Regeln Klassen zugeordnet und somit werden die normalisierten Regelausgaben einer bestimmten Klasse gewichtet und gemittelt. Dieser Prozess ist ebenso als Defuzzifizierung bekannt und umfasst die folgende Operation:
Sobald der Defuzzifizierungsprozess für jeden der Ausgabeknoten abgeschlossen ist, bestimmt der Knoten mit der größten Ausgabe die Klasse des Eingabemusters. In dem SONFIN wächst die Anzahl an Regelknoten in Lage 3 204, wenn mehr Eingaben präsentiert werden. Dieses Wachstum ist darauf basiert, dass die Auslösestärken einer jeden bestehenden Regel mit einem Schwellenwert versehen werden. Dann, wenn die Auslösestärke aller bestehenden Regeln unterhalb einer Schwelle liegt, wird ein neuer Regelknoten erzeugt, um die derzeitige Eingabe-Ausgabe-Abbildung zu repräsentieren. Auf diese Art und Weise entwickelt sich oder organisiert sich die Struktur des SONFIN selbst, wenn Daten präsentiert werden.
Ein weiteres wichtiges Merkmal während des Regelerzeugungsprozesses ist das Reduzieren der Zugehörigkeitsfunktionen (z.B. der Gauss'schen, der dreieckigen oder trapezoiden Zugehörigkeitsfunktion), welche entlang jeder Dimension für eine neu gebildete Regel rekrutiert werden. Wenn eine neue Regel gebildet wird, werden die Zugehörigkeitsfunktionen entlang jeder Dimension bezüglich einer Fuzzy-Ähnlichkeit mit anderen Zugehörigkeitsfunktionen entlang der Dimension geprüft, welche aufgrund von zuvor gebildeten Regeln bereits besteht. Wenn die Ähnlichkeit hoch ist (wie durch den Nutzer definiert), wird die Gauss'sche Zugehörigkeit für die neue Regel nicht hinzugefügt und umgekehrt.
Das grundlegende SONFIN umfasst die Fähigkeit, die Parameter des Netzwerks einzustellen. Eine Parametereinstellung wird durchgeführt, um die Parameter (z.B. Mittelwert und Varianz) der Zugehörigkeitsfunktionen derart konstant zu aktualisieren, dass sie eingestellt werden, um eine Fehlklassifizierung zu minimieren. Um ein Parametereinstellen durchzuführen, wendet das SONFIN den Rückwärtsausbreitungsalgorithmus an. Zuerst werden die Verbindungen in Lage 5 208 (w_i ⁽⁵⁾'s) aktualisiert. Dann wird der Fehler den ganzen Weg zurück zur Lage 2 202 ausgebreitet, bei welcher die Parameter einer jeden Zugehörigkeitsfunktion proportional zur Auslösestärke der Regel, die sie repräsentiert, aktualisiert werden. Details betreffend Rückwärtsausbreitungsverfahren werden durch die im Hintergrund bereitgestellten Verweise bereitgestellt.
Wenn mehr Eingabemuster präsentiert werden, werden die Parameter des Netzwerks eingestellt und gleichzeitig entwickelt sich die Netzwerkstruktur. Während SONFIN für niedrigdimensionale Klassifizierung und ebenso für eine Funktionsannäherung eine sehr gute Leistung bietet, hat das Netzwerk dann Probleme, wenn die Anzahl an Eingabedimensionen groß zu werden beginnt (mehr als 10 Eingabemerkmale).
Die Lage 3 204 von SONFIN, welche die Regellage repräsentiert, wird erzeugt durch Bilden eines Produkts von 1-dimensionalen Zugehörigkeitsfunktionen, wobei jede Dimension der Zugehörigkeitsfunktionen eine Eingabemerkmalsdimension repräsentiert. Diese Verfahren eines Kombinierens der Zugehörigkeitswerte von individuellen Zugehörigkeitsfunktionen ist als die Produktregel in der Fuzzylogic bekannt. Gauss'sche Zugehörigkeitsfunktionen sind die bevorzugte Klasse von Zugehörigkeitsfunktionen, da sie eine rechnerische Einfachheit bereitstellen (besonders, da eine N-dimensionale Gauss'sche Funktion ein fach als ein Produkt von N 1-dimensionalen Gauss'schen Zugehörigkeitsfunktionen zersetzt werden kann, was den Prozess einer Erklärung einer Regel unterstützt). Unglücklicherweise wird die Produktregel während des Parametereinstell/Lernprozesses nachteilig, wenn die Anzahl an Eingabedimensionen groß wird. Wie zuvor angemerkt wurde, wird das im SONFIN verwendete Lernen unter Verwendung des Rückwärtsausbreitungsalgorithmus durchgeführt. Die Idee hinter einem Einstellen unter Verwendung des Rückwärtsausbreitungsalgorithmus liegt darin, die Parameter der Zugehörigkeitsfunktionen einer jeden Regel derart zu verschieben, dass der Fehler bei einer Fehlklassifizierung minimiert wird. Wenn die Fehler von der Lage 5 208 (der Ausgabelage) zur Lage 2 202 (bei welcher die Parameter der Zugehörigkeitsfunktionen aktualisiert werden) rückwärts ausgebreitet werden, tritt ein wesentliches Problem auf, wenn die Eingabe hochdimensional ist. Der Fehler, welcher zur Lage 2 202 rückwärts ausgebreitet wird, um die Parameter der Zugehörigkeitsfunktionen einer Regel zu aktualisieren, hängt von der Auslösestärke jener Regel ab. Die Auslösestärke einer Regel ist bestimmt durch die Ausgabe der N-dimensionalen Zugehörigkeitsfunktionen (d.h. der Produktregel). Dann, wenn zu viele Eingabemerkmale vorhanden sind, wird die Auslösestärke der Regel untragbar klein. Wenn beispielsweise 20 Eingaben vorhanden sind und wenn die Zugehörigkeitswerte für jede Dimension 0,7 betragen, wird die Produktregel dazu führen, dass die Auslösestärke der Regel 0,000797922 beträgt. Dieses Problem wird offensichtlich verschärft, wenn die Anzahl an Dimensionen zunimmt. Das folgende ist ein Beispiel einer Verwendung von Gauss'schen Zugehörigkeitsfunktionen, welches diesen Effekt ausführlicher zeigt. Für eine eindimensionale Normalverteilung ist es bekannt, dass gilt:
Unter der Annahme, dass eine mehrdimensionale Gauss'sche vorliegt, dass eine diagonale Kovarianzmatrix verwendet wird und dass alle die diagonalen Elemente der Kovarianzmatrix die gleichen sind und gleich σ² sind, kann die mehrdimensionale Gauss'sche in die 1-dimensionalen Gauss'schen entlang einer jeden der Dimensionen faktorisiert werden. Es kann trivial gezeigt werden,
wobei n die Dimensionalität des Eingaberaums repräsentiert. Für n = 20 ist die Gleichung gleich 0,68²⁰ = 0,00045. Dies bedeutet, dass die meisten der Gauss'schen Kerne (d.h. Regionen, welche dem Mittelwert, dem ± σ, am nächsten liegen) leer sind. Wenn n groß ist, besteht daher keine Chance, dass eine Regel mit nennenswerter Stärke auslöst (wobei Auslösestärke einer Regel das Produkt von n 1-dimensionalen Gauss'schen ist), um irgendwelche Veränderungen an Gauss'schen Parametern während einem Rückwärtsausbreitungslernen auszuführen. Somit scheinen die meisten Punkte fern von dem Mittelwert der mehrdimensionalen Gauss'schen zu liegen. Äußerst kleine Werte der Auslösestärke resultieren wiederum in sehr geringen Änderungen am Mittelwert und an der Varianz der Gauss'schen während eines Rückwärtsausbreitungslernens, was somit zu einem vernachlässigbaren Lernen führt.
Ein weiterer wichtiger Engpass in dem grundliegenden SONFIN ist die Basis für eine Regelerzeugung. Wenn die Auslösestärken all der augenblicklich bestehenden Regeln unterhalb einer vom Nutzer definierten Schwelle liegt, wird eine neue Regel erzeugt, was impliziert, dass die momentane Stelle und Größe (d.h. Mittelwert bzw. Varianz bei einer Gauss'schen Zugehörigkeitsfunktion) der Zugehörigkeitsfunktionen, welche die augenblickliche Regelbasis repräsentieren, unangemessen ist, um das augenblickliche Eingabemuster zu repräsentieren. Das SONFIN versucht, dieses Problem auf zwei Arten zu überwinden. Die erste war, eine neue Regel durch Rekrutieren neuer Zugehörigkeitsfunktionen entlang einer jeden Eingabedimension derart zu erzeugen, dass die augenblickliche Eingabe in der Zukunft korrekt repräsentiert wird. Die andere ist, die Stelle und die Größe der Zugehörigkeitsfunktionen unter Verwendung des Parametereinstellprozesses anzupassen. Das Einstellen von Parametern wird dann nötig, wenn die Auslösestärke von wenigstens einer der Regeln größer als die Schwefle ist, jedoch die falsche Klasse repräsentiert. In diesem Fall versucht das SONFIN, das Problem durch Einstellen von Parametern unter Verwendung einer Rückwärtsausbreitung zu korrigieren. Dies bedeutet, dass die erzeugten Regeln einer Klasse falsch zugewiesen sein können, ohne dass ein Lernen möglich ist, um den Fehler zu korrigieren. Für hochdimensionale Probleme wird das SONFIN somit im Wesentlichen ein schlechter Clusteralgorithmus, wobei jedem Cluster ein Klassenlabel angeheftet wird. Dies beeinflusst nicht nur die Vorhersagefähigkeiten von SONFIN, sondern erzeugt auch eine untragbar große Anzahl an Regeln.
Details der vorliegenden Erfindung
Die vorliegende Erfindung beschäftigt sich mit hochdimensionalen Klassifizierungsaufgaben, wobei ein online lernendes Fuzzy-Inferenznetzwerk verwendet wird, wie etwa das SONFIN. Ein Blockdiagramm, welches die grundlegende Architektur einer Ausführungsform der vorliegenden Erfindung zeigt, ist in 3 gezeigt. Das online lernende Fuzzy-Inferenznetzwerk 300 repräsentiert ein Netzwerk, wie etwa das SONFIN. Die Ausgabe 200 des online lernenden Fuzzy-Inferenznetzwerks 300 wird einem Regeleinstell- und Lernvorschriftanwendungs-Prozessor 304 bereitgestellt. Der Regeleinstellungs- und Lernvorschriftanwendungs-Prozessor 304 stellt zwei Funktionen bereit.
Erstens, ein schwellenbasiertes Kriterium zur Regelaufstellung wird verwendet, um zu bestimmen, ob die Auslösestärke der unscharfen Regel mit der größten Auslösestärke für die Eingabe eine vorbestimmte Schwelle übersteigt. Wenn die Auslösestärke der Regel die vorbestimmte Schwelle übersteigt, welche eingestellt ist, um sicherzustellen, dass eine unscharfe Regel eine ausreichend große Ausgabe für eine rechnerische Effektivität bereitstellt, wird die Regel getestet, um zu bestimmen, ob sie Eingabedaten korrekt klassifiziert. Wenn die unscharfe Regel die Eingabedaten korrekt klassifiziert hat, wird eine Lernregel angewendet, um die Parameter der Zugehörigkeitsfunktionen der unscharfen Regel zu aktualisieren. Die Lernregel hilft sicherzustellen, dass die Zugehörig keitsfunktionen der unscharfen Regel eine minimale Überlappung mit den Zugehörigkeitsfunktionen anderer unscharfer Regeln entlang derselben Dimension aufweisen. Dann, wenn die unscharfe Regel die Eingabedaten nicht korrekt klassifiziert hat oder wenn die Auslösestärke der unscharfen Regel mit der größten Auslösestärke für die Eingabedaten nicht das vorbestimmte Schwellenniveau überschritten hat, wird eine neue unscharfe Regel erzeugt und der Regelbasis hinzugefügt, indem ein unscharfes Ähnlichkeitsmaß zwischen jeder Zugehörigkeitsfunktion der Regel und den entsprechenden Eingabedaten für die Dimension entsprechend der Zugehörigkeitsfunktion angewendet wird und indem die neue unscharfe Regel erzeugt wird, welche sowohl neue Zugehörigkeitsfunktionen entsprechend jenen Dimensionen, für welche das unscharfe Ähnlichkeitsmaß nicht erfüllt war, als auch jene Zugehörigkeitsfunktionen der ursprünglichen unscharfen Regel umfasst, welche jenen Dimensionen entsprechen, für die das unscharfe Maß erfüllt war. Dann, wenn es dem korrekten Klassenlabel zugewiesen ist, wird die neue Regel erzeugt. Der neue Selbstorganisationsprozess ist verbessert, da er keine Ausbreitung von Regeln gestattet, sondern eine Genauigkeit bei einer Zuweisung der Regeln zu dem richtigen Klassifizierungslabel gewährleistet.
Die neue Lernregel ist nicht auf einer Rückwärtsausbreitung basiert, sondern basiert auf einem fehlergewichteten k-Mittelwert-Algorithmus, welcher von den Eingabedimensionen unabhängig ist. Ein neuer, als Auslösefrequenzzahl f bezeichneter Parameter wird für jede unscharfe Regel eingeführt (repräsentiert als ein Knoten in 2). Dieser Parameter repräsentiert die kumulative Anzahl von Malen, die jede Regel in Lage 3 204 des Fuzzy-Inferenznetzwerks ausgelöst hat. Die Auslösefrequenz liefert ein statistisches Maß einer Wichtigkeit einer Regel für die Klassifizierungsaufgabe. Dann, wenn die Auslösefrequenz einer gegebenen Regel hoch ist, wird eine große Anzahl von Eingabeabtastungen, welche dem Netzwerk präsentiert wurden, durch die Regel repräsentiert und umgekehrt. Die neue Lernregel nutzt die Auslösefrequenz für jede Regel. Der andere wichtige Parameter, welchen die Lernvorschrift nutzt, ist der Fehler |e| bei einer Klassifizierung. Im Allgemeinen kann der Fehler |e| bei einer Klassifizierung als der Absolutwert zwischen dem Ausgabeklassenwert und dem der korrekten Klasse zugewiesenen Wert definiert werden. Unter Verwendung dieser zwei Parameter werden die Aktualisierungen für den Mittelwert und die Varianz im Falle von Gauss'schen Zugehörigkeitsfunktionen in der neuen Lernvorschrift geschrieben als:
wobei die Paare μ_IJ* und σ_IJ* sowie μ_iJ und σ_iJ den eingestellten bzw. nicht eingestellten Mittelwert und Varianz der I-ten Gauss'schen Zugehörigkeitsfunktion für die J-te Regel repräsentieren, welche die maximal auslösende Regel für die augenblickliche Eingabe x_i ist (für i = 1, ..., N, wobei N die Anzahl an Eingabedimensionen ist). Die vorliegende Erfindung verwendet die neue Lernvorschrift wie folgt. Wenn eine neue Regel J erzeugt wird, wird sie direkt dem korrekten Klassenlabel zugewiesen. Dies bedeutet, dass |e| 0 sein wird und dass der Mittelwert der Gauss'schen Zugehörigkeitsfunktion für jede Dimension als die Eingabe selbst gesetzt ist. Die Varianz ist auf eine vorbestimmte Anfangsbreite σ_init gesetzt. Die Auslösefrequenzzahl f_J für Regel J wird inkrementiert. Wenn die nächste Eingabe präsentiert wird und falls eine bestehende Regel auf Grundlage dessen ausgewählt wird, dass ihre Auslösestärke die vorbestimmte Schwelle übersteigt, werden die Zugehörigkeitsfunktionsparameter (typischerweise der Mittelwert und die Varianz der Zugehörigkeitsfunktionen) auf Grundlage der Größen des Fehlers bei einer Klassifizierung |e| und der Auslösefrequenzzahl f_J der Regel aktualisiert. Somit ist dann, wenn die Regel verhältnismäßig neu ist, ihre Auslösefrequenz niedrig und somit spielt die Größe eines Klassifizierungsfehlers eine wichtige Rolle bei einer Einstellung des Mittelwerts und der Varianz der Gauss'schen Zugehörigkeitsfunktionen. Wenn eine Regel in der Vergangenheit einige Male ausgelöst hat, steigt die Auslösefrequenzzahl f_J, so dass die Wirkung eines Fehlers bei einer Fehlklassfizierung für jene Regel abzunehmen beginnt, was die Erzeugung einer neuen Regel bewirkt. Auf diese Art und Weise sind die erzeugten Regeln robuster, da ihrer Vergangenheit eine Bedeutung gegeben wird und bereits in den Bildungsstufen einer Regel ist zahlreiches Gewicht den Fehlklassifizierungsfehlern |e| gegeben, mit dem Ziel, die Zugehörigkeitsfunktionsparameter zu verschieben, um den Fehlklassifizierungsfehler zu kompensieren. Eine weitere mögliche Variante liegt darin, ein Aktualisieren der Auslösefrequenz für eine Regel zu verhindern, wenn |e| größer als eine vom Nutzer definierte Schwelle ist. Diese Variation wird zu mehr Parametereinstellen für die Gauss'schen Zugehörigkeitsfunktionen einer gegebenen Regel führen und somit die Anzahl an erzeugten Regeln minimieren. Dabei ist wichtig, dass die vorliegende Erfindung, nicht wie bei dem grundlegenden SONFIN, keine Fehlklassifizierung einer Regel mit dem falschen zugewiesenen Klassenlabel gestattet. Ebenso hängen die Aktualisierungsgleichungen der vorliegenden Erfindung nicht von der Auslösestärke der Regel f_J ab, wodurch die mit einer hochdimensionalen Klassifizierung verbundenen Probleme vermieden werden, auf welche das grundlegende SONFIN trifft. Somit stellen die in der vorliegenden Erfindung verwendeten Lerngleichungen kombiniert mit dem Selbstorganisationsprozess ein online lernendes Fuzzy-Inferenznetzwerk bereit, welches in der Lage ist, hochdimensionale Klassifizierungsprobleme zu lernen.
Ein Flussdiagramm, welches das Verfahren der vorliegenden Erfindung ausführlich zeigt, ist in 4 bereitgestellt. Dieses Diagramm liefert eine Flussdarstellung der vorliegenden Erfindung unter Integration eines SONFIN-Netzwerks, wie es in 1 bereitgestellt ist, mit Erweiterungen und Modifikationen, welche ihm gestatten, bei hochdimensionalen Eingaben effektiv eine Leistung zu erbringen. Wie in 1 repräsentiert ein Abschnitt des Flussdiagramms ein gattungsgemäßes Fuzzy-Inferenznetzwerk 400, welches für ein Online-Lernen basierend auf dem SONFIN ausgebildet ist. Das SONFIN stellt die Anpassungen bereit, welche für eine Bereitstellung von Online-Lernen notwendig sind. In einem Eingabeschritt 401 wird dem Fuzzy-Inferenznetzwerk 400 ein N-dimensionales Eingabemuster bereitgestellt. Das Fuzzy-Inferenznetzwerk 400 berechnet dann die Zugehörigkeitswerte für jede Eingabedimension für jede Regel in einem Zugehörigkeitswert-Berechnungsschritt 402. In einem Auslösestärke-Prüfschritt 404 wird die Auslösestärke der Regeln auf Grundlage der Eingabe bestimmt und wird geprüft, ob sie eine vorbestimmte Schwelle übersteigt. Dann, wenn die Auslösestärke die Schwelle übersteigt, berechnet das Fuzzy-Inferenznetzwerk 400 in einem Normalisierungsschritt 406 normalisierte Regelstärken für die Regel. Das Fuzzy-Inferenznetzwerk 400 berechnet dann in einem Defuzzifizierungsschritt 408 eine Ausgabe unter Verwendung von Schwerpunktdefuzzifikation. In einem statischen Betrieb eines trainierten Netzwerks ist das Ergebnis des Defuzzifizierungsschritts 408 die Ausgabe des Fuzzy-Inferenznetzwerks 400. Nach einem Prüfen in dem Auslösestärke-Prüfschritt 404, um zu bestimmen, ob die Auslösestärke der Regeln die Schwelle übersteigt, wird dann, wenn die Regel die Schwelle übersteigt, in einem Regeleinstellschritt 410 ein unscharfes Ähnlichkeitsmaß zwischen der unscharfen Regel mit der größten Auslösestärke und den Testdaten angewendet. Das unscharfe Ähnlichkeitsmaß prüft jede Zugehörigkeitsfunktion der unscharfen Regel, um zu bestimmen, ob sie entlang jeder entsprechenden Dimension der Eingabedaten erfüllt ist. Aus einer Kombination jener Zugehörigkeitsfunktionen, welche das unscharfe Ähnlichkeitsmaß erfüllten und neuer Zugehörigkeitsfunktionen, um jene Zugehörigkeitsfunktionen zu ersetzen, welche das unscharfe Ähnlichkeitsmaß nicht erfüllten, wird eine neue Regel erzeugt. Die Parameter der neuen Zugehörigkeitsfunktionen sind derart gesetzt, dass sie mit den Eingabedaten übereinstimmen (z.B. ist der Mittelwert gleich dem Wert der Eingabedaten entlang der Dimension eingestellt, welcher die Zugehörigkeitsfunktion entspricht und eine voreingestellte Varianz ist bereitgestellt). Die Auslösestärkefrequenz f_J für eine neue Regel wird inkrementiert, so dass schließlich, wenn die Regel verwendet wird, die Lernregel angewendet werden kann. Weiterhin wird ein Klassifizierungslabel für die neue Regel derart bereitgestellt, dass sie mit der Klassifizierung für die Eingabedaten übereinstimmt, für welche die Regel erzeugt wurde. Sowohl die neue als auch die alte Regel werden in der Regelbasis bewahrt, und das Fuzzy-Inferenznetzwerk 400 kann mehr Eingabedaten annehmen. Falls die Auslösestärke der Regeln die Schwelle nicht übersteigt, wie in dem Auslösestärke-Prüfschritt 404 bestimmt wird, wird die unscharfe Regel mit der größten Auslösestärke in einem Ausgabeklassen-Prüfschritt 412 geprüft, um zu bestimmen, ob sie die Eingabedaten korrekt klassifiziert hat. Wenn die Regel die Eingabedaten nicht korrekt klassifiziert hat, wird der Regeleinstellschritt 410 auf die Regel angewandt, und das Fuzzy-Inferenznetzwerk 400 kann mehr Eingabedaten annehmen. Dann, wenn die Regel die Eingabedaten korrekt klassifiziert hat, wird nach dem Normalisierungsschritt 406 und dem Defuzzifizierungsschritt 408 die Lernregel in einem Lernvorschriftanwendungsschritt 414 angewendet, um die Parameter der Regel mit der größten Auslösestärke zu aktualisieren und das Fuzzy-Inferenznetzwerk 400 kann mehr Eingabedaten akzeptieren.
Sobald ein Fuzzy-Inferenznetzwerk 400 ausreichend unter Verwendung der vorliegenden Erfindung trainiert ist, kann die sich ergebende Regelbasis sowohl in Software ausgeführt sein, welche an einem Altzweck- oder Spezialzweckprozessor betrieben wird, oder kann direkt in Hardware eingebaut sein. Die Fähigkeit, die Regelbasis in Hardware auszuführen, sorgt im Allgemeinen für einen sehr viel schnelleren Betrieb zur Klassifizierung von Daten als eine vergleichbare Softwareausführungsform.
Ergebnisse Es wurden Auswertungen ausgeführt, um die Leistung der vorliegenden Erfindung unter Verwendung von 1-dimensionalen Infrarotreichweitenprofilsensordaten kombiniert mit Gewichtssensoren zur Fahrzeuginsassenerkennung zu bestimmen. Verwendete Sensordaten umfassten 31 Merkmale: 30 Strahlen mit Entfernungsinformation des Insassen in einem Autositz, gemessen von einem festen Ort in dem Auto und ein zusätzliches Signal von einem Gewichtssensor, welcher das durchschnittliche Gewicht des Insassen misst, welcher den Sitz belegt. Die Ergebnisse sind in 5 für drei Datensätze gezeigt, wobei die Aufgabe war, den Insassen auf dem Sitz in eine von mehreren Kategorien zu klas sifizieren, und zu bestimmen, ob ein Airbag aktiviert werden soll. In dem ersten Datensatz war die Klassifizierungsaufgabe, den Airbag für Säuglingssitze mit Blickrichtung nach hinten (RFIS = "Rear Facing Infant Seats") zu deaktivieren und den Airbag für Kindersitze mit Blickrichtung nach vorne (FFCS = "Front Facing Child Seats"), sich frei herumbewegende Kinder von 35 Pfund, Säuglingssitze mit Blickrichtung nach vorne (FFIS = "Front Facing Infant Seats") und Erwachsene in normalen Positionen zu aktivieren. Dabei machen üblicherweise die sich frei umherbewegenden 35 Pfund-Kinder das Auslesen des Gewichtssensors verrauschter als FFCS und FFIS. Erwachsene außer Position (OOP = "Out-Of-Position") waren in dem ersten Datensatz nicht enthalten. Der zweite Datensatz war mit dem ersten Datensatz identisch, abgesehen davon, dass die OOP als Aktivieren klassifiziert werden sollten. Im dritten Datensatz war die Klassifizierungsaufgabe, für FFIS zu deaktivieren und für FFCS, Erwachsene in normaler Position, sich frei umherbewegende 35 Pfund-Kinder und OOP zu aktivieren. In diesem Datensatz waren keine RFIS-Beispiele vorhanden. Diese Aufgaben weisen aufgrund des Überlappungsbetrags in den Sensormerkmalen für diese Situationen unterschiedliche Schwierigkeitsstufen auf. Es ist wichtig anzumerken, dass diese Anwendungen hochdimensionale Klassifizierungsaufgaben sind, und dass zur Simulation von Online-Lernen die Daten dem System in einer Einzelübergabe präsentiert wurden, wobei ein Lernen an jedem präsentierten Eingabemuster stattfand.
Die drei Datensätze wurden verwendet, um ein Netzwerk der vorliegenden Erfindung und ebenso Netzwerke vom Typ SONFIN und M-PROBART zu trainieren. Wie zuvor angemerkt wurde, ist die Leistung der vorliegenden Erfindung in der Tabelle von 5 zusammengefasst. Es wurden zwei unterschiedliche Leistungsmaße verwendet, um die Ergebnisse der vorliegenden Erfindung mit jenen anderer Netzwerke zu vergleichen. Das erste Maß war Genauigkeit in der Vorhersageleistung an den Testdaten (d.h. nicht am Trainingsdatensatz). Aus der Tabelle ist zu sehen, dass die Vorhersagegenauigkeit an dem Testsatz unter Verwendung der vorliegenden Erfindung sehr viel besser als jene des SONFIN und vergleichbar mit jener des M-PROBART für alle Datensätze ist. Da SONFIN aufgrund von Problemen mit hochdimensionalen Eingaben auf einen schlechten Cluster-Algorithmus reduziert ist, ist die Vorhersagegenauigkeit schlechter als jene der vorliegenden Erfindung. Die bessere Genauigkeit des M-PROBART verglichen mit SONFIN kann einem Selbstorganisierungsprozess zugeschrieben werden, welcher für Fehlübereinstimmungen in Ausgabeklassenzuweisungen verantwortlich ist, ähnlich jenen der vorliegenden Erfindung. Das zweite verwendete Leistungsmaß war die Anzahl an erzeugten Regeln. Für die vorliegende Erfindung war dieses Maß sowohl dem M-PROBART und dem SONFIN-Netzwerk überlegen. Im Falle von SONFIN ist der Unterschied in der Größe der extrahierten Regelbasis wiederum in der Unfähigkeit begründet, in hochdimensionalen Räumen zu lernen. Bezüglich des M-PROBART war der Unterschied in der Regelbasis hauptsächlich im Fehlen irgendeines Parametereinstellmechanismus begründet. Anders als die vorliegende Erfindung und SONFIN führt das M-PROBART auch kein Reduzieren der Gauss'schen entlang einer jeden Dimension durch. Zusammengefasst zeigen die Ergebnisse, dass die vorliegende Erfindung nicht nur genau ist, sondern dass sie in der Größe ihrer Regelbasis kompakter ist, verglichen mit den zwei führenden Online-Lernalgorithmen, welche augenblicklich in der Literatur verfügbar sind. Das Ergebnis liegt hauptsächlich an der neuen Lernvorschrift und dem Selbstorganisierungsprozess, welcher dazu gedacht ist, online für hochdimensionale Klassifizierungsaufgaben zu lernen.
Zusammenfassung
Die vorliegende Erfindung stellt ein verbessertes Verfahren und ein verbessertes System zum Trainieren eines online Fuzzy-Interferenznetzwerks bereit, um eine Regelbasis zu erzeugen, sowie eine dadurch erzeugte Regelbasis. Ein Drehen und Anwenden einer Lernregel auf die durch das Fuzzy-Interferenznetzwerk erzeugten unscharfen Regeln derart, dass die Leistung des Netzwerks von der Anzahl an Eingabedimensionen geschieden wird, gestattet die vorliegende Erfindung, ein Fuzzy-Inferenznetzwerk, wie etwa ein SONFIN, derart anzupassen, dass es für die Klassifizierung von hochdimensionalen Daten bei Problemen effektiv ist, welche die Verwendung einer hohen Anzahl von Dimensionen verwenden, wie etwa Insassenerkennung in Fahrzeugen, Wettervorhersage und Wirtschaftsvorhersagen.

Claims

Ein verbessertes Verfahren zur Erzeugung eines online lernenden Fuzzy-Inferenznetzwerks für die Klassifizierung von Daten unter Verwendung eines online lernenden Fuzzy-Inferenznetzwerks, wobei das Fuzzy-Inferenznetzwerk trainiert ist, um eine Regelbasis von unscharfen Regeln zu erzeugen, wobei jede unscharfe Regel einem Klassenlabel zugeordnet ist und jede unscharfe Regel wenigstens eine einer Dimension der Daten entsprechende Zugehörigkeitsfunktion aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkeiten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszugehörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslösestärke bestimmt wird, wobei die Zugehörigkeitsfunktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu bestimmen, wobei die Verbesserung umfasst: a. Speichern einer Auslösefrequenzzahl und Inkrementieren der Auslösefrequenzzahl für jede unscharfe Regel, was die Anzahl von Malen anzeigt, die die unscharfe Regel ausgelöst wurde; b. Bestimmen, ob die Auslösestärke der unscharfen Regel mit der größten Auslösestärke eine vorbestimmte Schwelle übersteigt; c. im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle übersteigt, Einstellen der unscharfen Regel auf Grundlage des Klassifizierungsfehlers; sowie d. im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle nicht übersteigt, Bestimmen, ob die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, korrekt mit der bekannten Klassifizierungszugehörigkeit der Testdaten übereinstimmt; i. in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wird, mit der bekannten Klassifizierungszugehörigkeit der Testdaten nicht korrekt übereinstimmt, Einstellen der unscharfen Regel auf Grundlage des Klassifizierungsfehlers wie in Schritt c; sowie ii. in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wird, mit der bekannten Klassifizierungszugehörigkeit der Testdaten korrekt übereinstimmt, Anwenden einer Lernregel, um die Zugehörigkeitsfunktionsparameter derart zu aktualisieren, dass der Klassifizierungsfehler für hochdimensionale Klassifizierungsaufgaben minimiert wird.
Eine Regelbasis, welche durch das Verfahren von Anspruch 1 erzeugt wird.
Ein verbessertes Verfahren zur Erzeugung eines online lernenden Fuzzy-Inferenznetzwerks zur Klassifizierung von Daten unter Verwendung eines online lernenden Fuzzy-Inferenznetzwerks nach Anspruch 1, wobei der Einstellschritt c der Verbesserung ferner die folgenden Unterschritte umfasst: i. Anwenden eines unscharfen Ähnlichkeitsmaßes, um die Zugehörigkeitsfunktion entlang einer jeden Dimension der Testdaten mit den Testdaten zu vergleichen; ii. Hinzufügen einer neuen Zugehörigkeitsfunktion entlang jener Dimensionen, bei welchen das unscharfen Ähnlichkeitsmaß nicht erfüllt ist; iii. Erzeugen einer neuen unscharfen Regel einschließlich der neuen Zugehörigkeitsfunktionen und jener Zugehörigkeitsfunktionen, welche das unscharfen Ähnlichkeitsmaß erfüllt haben; sowie iv. Hinzufügen der neuen Regel zu der Regelbasis.
Ein verbessertes Verfahren zur Erzeugung eines online lernenden Fuzzy-Inferenznetzwerks zur Klassifizierung von Daten unter Verwendung eines online lernenden Fuzzy-Inferenznetzwerks nach Anspruch 3, wobei der Einstellschritt c der Verbesserung ferner die folgenden Unterschritte umfasst: i. Zuweisen eines Mittelwertes zu jeder neuen Zugehörigkeitsfunktion gleich dem Wert der Testdaten, entsprechend der Dimension entsprechend der jeweiligen neuen Zugehörigkeitsfunktion; ii. Inkrementieren der Auslösefrequenzzahl für eine neue unscharfe Regel; sowie iii. Zuweisen einer Klassifizierungszugehörigkeit zu der neuen unscharfen Regel, welche mit der Klassifizierungszugehörigkeit der Testdaten übereinstimmt, für welche die Regel ausgelöst wird.
Eine Regelbasis, welche durch das Verfahren von Anspruch 4 erzeugt wurde.
Ein verbessertes Verfahren zur Erzeugung eines online lernenden Fuzzy-Inferenznetzwerks zur Klassifizierung von Daten unter Verwendung eines online lernenden Fuzzy-Inferenznetzwerks nach Anspruch 4, wobei die Zugehörigkeitsfunktionen aus der Gruppe ausgewählt werden, welche besteht aus Gauss'schen Zugehörigkeitsfunktionen, Dreiecks-Zugehörigkeitsfunktionen und trapezoiden Zugehörigkeitsfunktionen.
Ein verbessertes Verfahren zur Erzeugung eines online lernenden Fuzzy-Inferenznetzwerks zur Klassifizierung von Daten unter Verwendung eines online lernenden Fuzzy-Inferenznetzwerks nach Anspruch 4, wobei die Zugehörigkeitsfunktionen Gauss'sche Zugehörigkeitsfunktionen sind und die Zugehörigkeitsfunktionsparameter einer jeden Gauss'schen Zugehörigkeitsfunktion einen Mittelwert und eine Varianz umfassen und wobei die im Falle von Schritt d(ii) angewendete Lernregel den Mittelwert und die Varianz der Gauss'schen Zugehörigkeitsfunktionen der unscharfen Regel mit der größten Auslösestärke nach der folgenden Maßgabe aktualisiert:
wobei μ* den aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert, σ* die aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, μ den nicht aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert, σ die nicht aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, |e| den Klassifizierungsfehler für die Gauss'sche Zugehörigkeitsfunktion repräsentiert, x den speziellen Wert der Testdaten für die der Gauss'schen Zugehörigkeitsfunktion entsprechende Dimension repräsentiert, und f die Auslösefrequenz für die spezielle unscharfe Regel repräsentiert, auf welche die Lernregel angewendet wird.
Ein verbessertes Verfahren zur Erzeugung eines online lernenden Fuzzy-Inferenznetzwerks zur Klassifizierung von Daten unter Verwendung eines online lernenden Fuzzy-Inferenznetzwerks nach Anspruch 1, wobei die Zugehörigkeitsfunktionen Gauss'sche Zugehörigkeitsfunktionen sind und die Zugehörigkeitsfunktionsparameter einer jeden Gauss'schen Zugehörigkeitsfunktion einen Mittelwert und eine Varianz umfassen und wobei die im Falle von Schritt d(ii) angewendete Lernregel den Mittelwert und die Varianz der Gauss'schen Zugehörigkeitsfunktionen der unscharfen Regel mit der größten Auslösestärke nach der folgenden Maßgabe aktualisiert:
wobei μ* den aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert, σ* die aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, μ den nicht aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert, σ die nicht aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, |e| den Klassifizierungsfehler für die Gauss'sche Zugehörigkeitsfunktion repräsentiert, x den speziellen Wert der Testdaten für die der Gauss'schen Zugehörigkeitsfunktion entsprechende Dimension repräsentiert, und f die Auslösefrequenz für die spezielle unscharfe Regel repräsentiert, auf welche die Lernregel angewendet wird.
Eine Regelbasis, welche durch das Verfahren von Anspruch 8 erzeugt wurde.
Ein verbessertes Verfahren zur Erzeugung eines online lernenden Fuzzy-Inferenznetzwerks zur Klassifizierung von Daten, umfassend die folgenden Schritte: a. Bereitstellen eines online lernenden Fuzzy-Inferenznetzwerks, wobei das Fuzzy-Inferenznetzwerk eine Regelbasis von unscharfen Regeln erzeugt, wobei jede unscharfe Regel einem Klassenlabel zugeordnet ist und jede unscharfe Regel wenigstens eine Zugehörigkeitsfunktion entsprechend einer Dimension der Daten aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkei ten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszugehörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslösestärke bestimmt wird, wobei die Zugehörigkeitsfunktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu bestimmen, und wobei die Auslösefrequenzzahl einer jeden unscharfen Regel gespeichert wird, wobei die Verbesserung umfasst: b. Bestimmen, ob die Auslösestärke der unscharfen Regel mit der größten Auslösestärke eine vorbestimmte Schwelle übersteigt; c. im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle übersteigt, Einstellen der unscharfen Regel auf Grundlage des Klassifizierungsfehlers; sowie d. im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle nicht übersteigt, Bestimmen, ob die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, korrekt mit der bekannten Klassifizierungszugehörigkeit der Testdaten übereinstimmt; i. in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wird, mit der bekannten Klassifizierungszugehörigkeit der Testdaten nicht korrekt übereinstimmt, Einstellen der unscharfen Regel auf Grundlage des Klassifizierungsfehlers wie in dem durch c repräsentierten Fall; sowie ii. in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wird, mit der bekannten Klassifizierungszugehörigkeit der Testdaten korrekt übereinstimmt, Anwenden einer Lernregel, um die Zugehörigkeitsfunktionsparameter derart zu aktualisieren, dass der Klassifizierungsfehler für hochdimensionale Klassifizierungsaufgaben minimiert wird.
Ein verbessertes Trainingssystem für ein Fuzzy-Inferenznetzwerk zur Online-Klassifizierung von Daten umfassend ein Fuzzy-Inferenznetzwerk zur Erzeugung einer Regelbasis von unscharfen Regeln, wobei jede unscharfe Regel einem Klassenlabel zugeordnet ist und jede unscharfe Regel wenigstens eine einer Dimension der Daten entsprechende Zugehörigkeitsfunktion aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkeiten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszugehörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslösestärke bestimmt wird, wobei die Zugehörigkeitsfunktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu bestimmen, wobei die Verbesserung umfasst: eine Auslösefrequenzzahl, welche für jede unscharfe Regel berechnet wird und jedes mal dann inkrementiert wird, wenn die unscharfe Regel ausgelöst wird, wobei die Auslösefrequenzzahl in der Verarbeitungsvorrichtung gespeichert wird, sowie einen Regeleinstell- und Lernregelanwendungsprozessor, welcher mit dem Fuzzy-Inferenznetzwerk verbunden ist, um die unscharfen Regeln; den Klassifizierungsfehler; die Auslösestärke, die Auslösefrequenzzahl und die durch die unscharfe Regel mit der größten Auslösestärke erzeugte Klassifizierungszugehörigkeit; die Testdaten und die bekannten Klassifizierungszugehörigkeiten für die Testdaten zu erhalten; wobei der Prozessor derart arbeitet, dass er bestimmt, ob die Auslösestärke der unscharfen Regel mit der größten Auslösestärke eine vorbestimmte Schwelle übersteigt; sowie a. dass er im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle übersteigt, die unscharfe Regel auf Grundlage des Klassifizierungsfehlers einstellt; sowie b. dass er im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle nicht übersteigt, bestimmt, ob die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, korrekt mit der bekannten Klassifizierungszugehörigkeit der Testdaten übereinstimmt; i. in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, mit der bekannten Klassifizierungszugehörigkeit der Testdaten nicht korrekt übereinstimmt, dass er die unscharfe Regel auf Grundlage des Klassifizierungsfehlers einstellt; sowie ii. in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, mit der bekannten Klassifizierungszugehörigkeit der Testdaten korrekt übereinstimmt, dass er eine Lernregel anwendet, um die Zugehörigkeitsfunktionsparameter derart zu aktualisieren, dass der Klassifizierungsfehler für hochdimensionale Klassifizierungsaufgaben minimiert wird.
Eine Regelbasis, welche durch das Trainingssystem von Anspruch 11 erzeugt wurde.
Ein verbessertes Trainingssystem für ein Fuzzy-Inferenznetzwerk zur Online-Klassifizierung von Daten nach Anspruch 11, wobei der Regeleinstell- und Lernregelanwendungsprozessor ferner derart arbeitet, dass er: a. ein unscharfes Ähnlichkeitsmaß anwendet, um die Zugehörigkeitsfunktion entlang einer jeden Dimension der Testdaten mit den Testdaten zu vergleichen; b. eine neue Zugehörigkeitsfunktion entlang jener Dimensionen hinzufügt, bei welchen das unscharfe Ähnlichkeitsmaß nicht erfüllt ist; c. eine neue unscharfe Regel einschließlich der neuen Zugehörigkeitsfunktionen und jener Zugehörigkeitsfunktionen erzeugt, welche das unscharfe Ähnlichkeitsmaß erfüllt haben; sowie d. die neue Regel zu der Regelbasis hinzufügt.
Ein verbessertes Trainingssystem für ein Fuzzy-Inferenznetzwerk zur Online-Klassifizierung von Daten nach Anspruch 13, wobei der Regeleinstell- und Lernregelanwendungsprozessor ferner derart arbeitet, dass er: a. einer jeden neuen Zugehörigkeitsfunktion einen Mittelwert gleich dem Wert der Testdaten zuweist, entsprechend der Dimension entsprechend der jeweiligen neuen Zugehörigkeitsfunktion; b. die Auslösefrequenzzahl für eine neue unscharfe Regel inkrementiert; sowie c. der neuen unscharfen Regel eine Klassifizierungszugehörigkeit zuweist, welche mit der Klassifizierungszugehörigkeit der Testdaten übereinstimmt, für welche die Regel ausgelöst wird.
Ein verbessertes Trainingssystem für ein Fuzzy-Inferenznetzwerk zur Online-Klassifizierung von Daten nach Anspruch 14, wobei die Zugehörigkeitsfunktionen aus der Gruppe ausgewählt sind, welche besteht aus Gauss'schen Zugehörigkeitsfunktionen, Dreiecks-Zugehörigkeitsfunktionen und trapezoiden Zugehörigkeitsfunktionen.
Ein verbessertes Trainingssystem für ein Fuzzy-Inferenznetzwerk zur Online-Klassifizierung von Daten nach Anspruch 14, wobei die Zugehörigkeitsfunktionen Gauss'sche Zugehörigkeitsfunktionen sind und die Zugehörigkeitsfunktionsparameter einer jeden Gauss'schen Zugehörigkeitsfunktion einen Mittelwert und eine Varianz umfassen und wobei die angewendete Lernregel den Mittelwert und die Varianz der Gauss'schen Zugehörigkeitsfunktionen der unscharfen Regel mit der größten Auslösestärke nach der folgenden Maßgabe aktualisiert:
wobei μ* den aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert, σ* die aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, μ den nicht aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert, σ die nicht aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, |e| den Klassifizierungsfehler für die Gauss'sche Zugehörigkeitsfunktion repräsentiert, x den speziellen Wert der Testdaten für die der Gauss'schen Zugehörigkeitsfunktion entsprechende Dimension repräsentiert, und f die Auslösefrequenz für die spezielle unscharfe Regel repräsentiert, auf welche die Lernregel angewendet wird.
Ein verbessertes Trainingssystem für ein Fuzzy-Inferenznetzwerk zur Online-Klassifizierung von Daten nach Anspruch 11, wobei die Zugehörigkeitsfunktionen Gauss'sche Zugehörigkeitsfunktionen sind und die Zugehörigkeitsfunktionsparameter einer jeden Gauss'schen Zugehörigkeitsfunktion einen Mittelwert und eine Varianz umfassen und wobei die Lernregel den Mittelwert und die Varianz der Gauss'schen Zugehörigkeitsfunk tionen der unscharfen Regel mit der größten Auslösestärke nach der folgenden Maßgabe aktualisiert:
wobei μ* den aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert, σ* die aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, μ den nicht aktualisierten Mittelwert der Gauss'schen Zugehörigkeitsfunktion repräsentiert, σ die nicht aktualisierte Varianz der Gauss'schen Zugehörigkeitsfunktion repräsentiert, |e| den Klassifizierungsfehler für die Gauss'sche Zugehörigkeitsfunktion repräsentiert, x den speziellen Wert der Testdaten für die der Gauss'schen Zugehörigkeitsfunktion entsprechende Dimension repräsentiert, und f die Auslösefrequenz für die spezielle unscharfe Regel repräsentiert, auf welche die Lernregel angewendet wird.
Eine Regelbasis, welche durch das Trainingssystem von Anspruch 17 erzeugt wurde.
Ein verbessertes Trainingssystem für ein Fuzzy-Inferenznetzwerk zur Online-Klassifizierung von Daten, umfassend: a. ein online lernendes Fuzzy-Inferenznetzwerk, wobei das Fuzzy-Inferenznetzwerk eine Regelbasis von unscharfen Regeln erzeugt, wobei jede unscharfe Regel einem Klassenlabel zugeordnet ist und jede unscharfe Regel wenigstens eine Zugehörigkeitsfunktion entsprechend einer Dimension der Daten aufweist, wobei jede Zugehörigkeitsfunktion Zugehörigkeitsfunktionsparameter umfasst, wobei die unscharfen Regeln zur Klassifizierung von Eingabedaten in Zugehörigkeiten verwendet werden, wobei Testdaten mit einer bekannten Klassifizierungszuge hörigkeit dem Fuzzy-Inferenznetzwerk bereitgestellt werden und wobei das Fuzzy-Inferenznetzwerk die unscharfen Regeln verwendet, um Klassifizierungszugehörigkeiten für die Testdaten zu erzeugen, indem die unscharfen Regeln ausgelöst werden, wobei jeder ausgelösten unscharfen Regel eine Auslösestärke auf Grundlage ihrer Übereinstimmung mit den Testdaten zugewiesen wird, und indem die unscharfe Regel mit der größten Auslösestärke bestimmt wird, wobei die Zugehörigkeitsfunktionen der Regel mit der größten Auslösestärke mit der bekannten Klassifizierungszugehörigkeit der Testdaten verglichen werden, um einen Klassifizierungsfehler zu bestimmen, wobei die Auslösefrequenzzahl einer jeden unscharfen Regel gespeichert wird; b. einen Regeleinstell- und Lernregelanwendungsprozessor, welcher mit dem Fuzzy-Inferenznetzwerk verbunden ist, um die unscharfen Regeln; den Klassifizierungsfehler; die Auslösestärke, die Auslösefrequenzzahl und die durch die unscharfe Regel mit der größten Auslösestärke erzeugte Klassifizierungszugehörigkeit; die Testdaten und die bekannten Klassifizierungszugehörigkeiten für die Testdaten zu erhalten; wobei der Prozessor derart arbeitet, dass er bestimmt, ob die Auslösestärke der unscharfen Regel mit der größten Auslösestärke eine vorbestimmte Schwelle übersteigt; sowie i. dass er im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle übersteigt, die unscharfe Regel auf Grundlage des Klassifizierungsfehlers einstellt; sowie ii. dass er im Falle, dass die Auslösestärke der unscharfen Regel mit der größten Auslösestärke die Schwelle nicht übersteigt, bestimmt, ob die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, korrekt mit der bekannten Klassifizierungszugehörigkeit der Testdaten übereinstimmt; a. in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, mit der bekannten Klassifizierungszugehörigkeit der Testdaten nicht korrekt übereinstimmt, dass er die unscharfe Regel auf Grundlage des Klassifizierungsfehlers einstellt; sowie b. in dem Falle, dass die Klassifizierungszugehörigkeit, welche durch die unscharfe Regel mit der größten Auslösestärke erzeugt wurde, mit der bekannten Klassifizierungszugehörigkeit der Testdaten korrekt übereinstimmt, dass er eine Lernregel anwendet, um die Zugehörigkeitsfunktionsparameter derart zu aktualisieren, dass der Klassifizierungsfehler für hochdimensionale Klassifizierungsaufgaben minimiert wird.