DE19641066A1

DE19641066A1 - Verfahren zur direkten adaptiven Regelung nichtlinearer Strecken

Info

Publication number: DE19641066A1
Application number: DE1996141066
Authority: DE
Inventors: Dierk Schroeder; Kurt Fischle
Original assignee: Schroeder Dierk Prof Dr-Ing Dr-Ing Hc 82049 Pullach De
Current assignee: Schroeder Dierk Prof Dr-Ing Dr-Ing Hc 82049 Pullach De
Priority date: 1996-10-04
Filing date: 1996-10-04
Publication date: 1998-04-23

Description

1 Beschreibung und Kritik des Standes der Technik

Bei industriellen Anwendungen der Regelungstechnik sind häufig Strecken zu regeln, welche durch ausge prägte Nichtlinearitäten gekennzeichnet sind und bei denen weiterhin Parameter und Struktur nicht exakt bekannt sind. Zur Regelung solcher Strecken dienen adaptive nichtlineare Regelungsverfahren. Diese lassen sich zunächst einteilen in Verfahren, die auf eine bestimmte Streckenstruktur zugeschnitten sind, und weit gehend universell einsetzbare Verfahren. Zur zweiten Klasse gehören Regelungsverfahren mit neuronalen Netzen sowie adaptive Fuzzy-Regler. Bei den meisten dieser Verfahren ist über die Stabilität und Konver genz des Gesamtsystems aus Strecke, Regler und Adaptionsgesetz keine Aussage möglich; daher können diese Verfahren nur zur Regelung von Strecken eingesetzt werden, die nicht stabilitätskritisch sind, und es sind zusätzliche Überwachungsmaßnahmen erforderlich. Bei einer Reihe von Verfahren ist dagegen ein Sta bilitätsbeweis möglich. Hierbei ist zu unterscheiden zwischen indirekten Verfahren, bei denen zunächst eine Identifikation der Strecke und darauf abgestimmt die Regelung aufgrund des identifizierten Streckenmodells erfolgt; bei direkten Verfahren, wird dagegen der Regler direkt adaptiert, um ein vorgegebenes Verhalten des Regelkreises zu erreichen. Während bei indirekten Verfahren ein Stabilitätsbeweis i.a. nur für das Teil system Strecke - Identifikationsmodell - Adaptionsgesetz möglich ist, kann bei direkten Verfahren Stabilität für das Gesamtsystem aus Strecke, Regler und Adaptionsgesetz bewiesen werden. Es wurde bislang bereits eine Reihe solcher Verfahren veröffentlicht: Tzirkel, E., and Fallside, F., A Direct Control Method for a Class of Nonlinear Systems Using Neutral Networks, Technical Report, Cambridge University Engineering Department, Cambridge, 1993; E. Tzirkel-Hancock and F. Fallside, Stable Control of Nonlinear Systems Using Neural Networks, Int. J. Robust and Nonlinear Control, Vol. 2, no. 1, 1992; Robert M. Sanner and Jean-Jacques E. Slotine, Gaussian Networks for Direct Adaptive Control, IEEE Transactions on Neural Networks, Vol. 3, no. 6, 1992; Clemens Schäffner and Dierk Schröder, An Application of General Regres sion Neural Network to Nonlinear Adaptive Control, 5th European Conference on Power Electronics and Applications (EPE), Vol. 4, Brighton, 1993; Clemens Schäffner, Analyse und Synthese neuronaler Regelungs verfahren, Dissertation, Technische Universität München, Lehrstuhl für elektrische Antriebstechnik, 1996; Li-Xin Wang, Slable Adaptive Fuzzy Control of Nonlinear Systems, IEEE Transactions on Fuzzy Systems, Vol. 1, 1993.

Diese Regelungsverfahren basieren auf der Grundstruktur nach Abb. 1, wobei statt des Fuzzy-Reglers auch genausogut ein neuronales Netz als nichtlinearer Funktionsapproximator eingesetzt werden kann. Gege ben ist eine nichtlineare Strecke bekannter Ordnung, deren Struktur und Parameter jedoch völlig unbekannt oder nur zum Teil bekannt sind, sowie ein Referenzmodell, welches das gewünschte Führungsverhalten des geschlossenen Regelkreises vorgibt. Das Referenzmodell ist so zu gestalten, daß die physikalischen Gege benheiten der realen nichtlinearen Strecke und des Stellgliedes berücksichtigt werden. Die Strecke ist so zu regeln, daß ihre Ausgangsgröße y dem Referenzsignal y_m folgt. u ist die Stellgröße, x der Zustandsvektor der Strecke, n die Ordnung der Strecke und e = y-y_m der Ausgangsfehler. Das Regelgesetz ist von der Form

hierbei stellen die Ausdrücke θ T|1ξ(x) und θ T|2ξ(x) universelle nichtlineare Funktionsapproximatoren dar, also z. B. neuronale Netze mit radialen Basisfunktionen oder adaptive Fuzzy-Regler (s. u.). Die Parametervektoren dieser Funktionsapproximatoren werden durch ein Adaptionsgesetz der Form

eingestellt. Dabei ist γ die Adaptionsverstärkung. Mit Hilfe der Stabilitätstheorie von Ljapunow kann nun gezeigt werden, daß das Gesamtsystem stabil ist und der Fehler e gegen Null konvergiert, wenn die Strecke und die Eingangssignale gewissen Bedingungen genügen und die Koeffizienten p₁ . . . p_n die sog. Ljapunow- Gleichung erfüllen.

Die bislang veröffentlichten Verfahren weisen jedoch eine Reihe von Nachteilen auf, die einer breiten praktischen Anwendung entgegenstehen bzw. diese praktisch verhindern:

- Sowohl für das Regelgesetz als auch für das Adaptionsgesetz werden n-1 Ableitungen der Regelgröße benötigt (n = Ordnung der Strecke); in der Praxis ist dies jedoch aufgrund der immer vorhandenen Meßstörungen im allgemeinen nicht realisierbar.
- Die Verfahren funktionieren nicht bei Vorhandensein einer Stellgrößenbegrenzung; das Vorhandensein einer solchen Begrenzung bewirkt i.a. eine Divergenz der adaptierten Parameter, d. h. Instabilität. In der Praxis sind jedoch bei keiner Strecke unbegrenzte Stellgrößen möglich; in den meisten Fällen ist die Stellgröße soweit begrenzt, daß die Begrenzung auch in real vorkommenden Betriebszuständen erreicht wird.
- Rechenzeit- und Speicherplatzbedarf wachsen exponentiell mit der Ordnung der Strecke an. Auch die Zeit bis zum Erlernen des gewünschten Regelgesetzes wächst stark mit der Ordnung der Strecke an und ist generell relativ groß. Diese Zeit ergibt sich aus der Dynamik des Gesamtsystems aus Strecke, Regler und Adaptionsgesetz und hängt von zahlreichen Einflußfaktoren ab; bereits für relativ einfache Strecken dritter Ordnung kann sie bei mehreren Tagen liegen, was in der Praxis nicht tolerierbar ist.

Im folgenden Abschnitt wird ein verbessertes adaptives nichtlineares direktes Regelungsverfahren be schrieben, welches diese Nachteile behebt.

2 Darstellung der Erfindung 2.1 Verfahren

Dem Verfahren liegt wieder die Systemstruktur nach Abb. 1 zugrunde. Die Strecke ist so zu regeln, daß ihre Ausgangsgröße y dem Referenzsignal y_m folgt. Für eine bestimmte Klasse von Strecken und Refe renzmodellen kann mittels des Ansatzes der Input-Output-Linearisierung (s. J. Slotine und W. Li, Applied Nonlinear Control) gezeigt werden, daß ein Regelgesetz existiert, welches diese Aufgabe erfüllt. Dieses "idea le" Regelgesetz kann aber nicht explizit berechnet werden, da die Strecke unbekannt ist; daher werden zu seiner Ermittlung Methoden der künstlichen Intelligenz eingesetzt. Hierfür kommen alle Verfahren in Frage, die zum Erlernen statischer nichtlinearer Funktionen geeignet sind, also Radial-Basis-Function-Netzwerke (s. Tzirkel, E., and Fallside, F., A Direct Control Method for a Class of Nonlinear Systems Using Neural Networks, und Robert M. Sanner and Jean-Jacques E. Slotine, Gaussian Networks for Dired Adaptive Con trol), General-Regression-Netzwerke (s. Clemens Schäffner and Dierk Schröder, An Application of General Regression Neural Network to Nonlinear Adaptive Control) oder adaptive Fuzzy-Regler (s. Li-Xin Wang, Stable Adaptive Fuzzy Control of Nonlinear Systems). Das Grundprinzip bleibt bei allen genannten Verfah ren gleich; der Einsatz eines Fuzzy-Reglers hat dabei den Vorteil, daß das Regelgesetz nicht als "black box", sondern in Form anschaulicher WENN-DANN-Regeln vorliegt. Dies ist besonders nützlich, wenn verbal formuliertes Vorwissen zur Initialisierung des Reglers genutzt werden soll. In den folgenden Ausführungen soll deshalb der Ansatz unter Verwendung von Fuzzy-Reglern dargestellt werden; dies soll aber nur als Beispiel dienen und bedeutet keine Beschränkung der vorgestellten Verfahren auf die Fuzzy-Regelung, d. h. es können auch die anderen Methoden verwendet werden.

2.1.1 Regelgesetz ohne Differentiation der Regelgröße

Das Regelgesetz zur Berechnung der Stellgröße u aus dem Sollwert w und dem Zustandsvektor x kann unterschiedliche Formen besitzen. Die einfachste Form ist

hierbei ist θ ^T ξ(w, x) ein universeller nichtlinearer Funktionsapproximator, z. B. ein neuronales Netzwerk mit radialen Basisfunktionen, ein allgemeines neuronales Regressionsnetzwerk oder ein bestimmter Typ von Fuzzy-Regler (s. Li-Xin Wang, Stable Adaptive Fuzzy Control of Nonlinear Systems). Der Vektor θ enthält die einstellbaren Parameter des Funktionsapproximators, der Vektor ξ enthält lokalisierte Basisfunktionen, von denen jede in einem begrenzten Bereich des Eingangsgrößenraumes zur Approximation beiträgt, im übrigen Eingangsgrößenraum dagegen Null oder näherungsweise Null ist.

Dieses Regelgesetz ist nur für Strecken einsetzbar, bei denen die Lie-Ableitung L_gL n-1|fh(x) (s. u.) kon stant ist. Ist L_gL n-1|fh(x) nicht konstant, findet das Regelgesetz

Anwendung. Im Gegensatz zu Regelgesetzen der Form (1) benötigen diese Regelgesetze keine Differentiation des Fehlers e und damit der Regelgröße y. Ihre Einsetzbarkeit beruht auf dem Hilfssatz 1. (Die hier ange gebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)

2.1.2 Regelgesetz mit verringerter Parameteranzahl

Bei den beiden soeben genannten Regelgesetzen ist die Stellgröße eine allgemeine nichtlineare Funktion aller Reglereingangsgrößen. Daher werden universelle Funktionsapproximatoren benötigt, welche alle Reglerein gangsgrößen als Eingangsgrößen besitzen. Dies führt bei Strecken höherer Ordnung zu Problemen mit dem Rechenzeit- und Speicherplatzbedarf sowie der Lernzeit. Eine mögliche Lösung besteht darin, das Regelge setz in lineare und nichtlineare Teilfunktionen aufzuteilen, die dann getrennt erlernt werden können. Eine solche Aufteilung kann aufgrund von Vorwissen über die Streckenstruktur vorgenommen werden. In vielen Fällen ist es möglich, die Differentialgleichungen der Strecke in bekannte und unbekannte Teilfunktionen aufzuteilen. Für dieses teilweise bekannte Streckenmodell kann dann über die Lie-Ableitungen das ideale Regelgesetz berechnet werden. Es hat die allgemeine Form (vgl. Hilfssatz 1)

wobei die Teilfunktionen f*_ki,j(x) bekannt und die Teilfunktionen f*_ui,j(x) unbekannt sind. b_1m ist der erste Zählerkoeffizient des Referenzmodells. Der wesentliche Vorteil besteht nun darin, daß i.a. die unbekannten Teilfunktionen f*_ui,j(x) nicht von allen Reglereingangsgrößen abhängen, sondern nur von einigen bestimm ten Eingangsgrößen. Welche Teilfunktionen von welchen Eingangsgrößen abhängen, ist im voraus bekannt. Dieses Vorwissen wird zur Aufstellung des Regelgesetzes

verwendet. Der Vorteil besteht nun darin, daß auch hier die unbekannten nichtlinearen Teilfunktionen θ T|i,jξ _i,j(x) nicht von allen Reglereingangsgrößen abhängen. Dadurch haben die Basisfunktionen eine niedri gere Dimension, und es werden insgesamt weniger Parameter benötigt (s. Beispiel in Abschnitt 2.2). (Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens ver deutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)

2.1.3 Regelgesetz mit Ausnutzung von Symmetrieeigenschaften

Eine Reduktion der Parameteranzahl - und damit von Rechenzeit- und Speicherplatzbedarf sowie Lernzeit- kann durch Ausnutzung von Symmetrieeigenschaften erreicht werden. Die Dynamik vieler Strecken weist (näherungsweise) Symmetrieeigenschaften zum Punkt

aus denen folgt, daß

ist. Folglich ist alle Information, die zur Beschreibung des Regelgesetzes erforderlich ist, in der Hälfte des Parametervektors enthalten. Um dies auszunutzen, werden auch die Basisfunktionen

des nichtlinearen Funktionsapproximators symmetrisch zum Punkt

angeordnet. Der Basisfunktionsvektor ξ wird in zwei gleich große Untervektoren ξ ⁺ und ξ ⁻ unterteilt, so daß gilt:

(Liegt eine Basisfunktion genau symmetrisch zum Punkt

so muß der zugehörige Parameter Null sein; daher kann diese Basisfunktion weggelassen werden.) Wird nun der Parametervektor θ ebenfalls in zwei entsprechende Untervektoren θ⁺ und θ⁻ aufgeteilt, kann ein neues Regelgesetz als u' = θ' ^T ξ' mit θ' = θ⁺ und ξ' = ξ⁺ - ξ⁻ geschrieben werden. Da θ⁺ = -θ⁻ ist (aufgrund der Symmetrie von f_c), ergibt sich u' = u. Das neue Regelgesetz liefert also die gleiche Stellgröße wie (3), kommt aber mit der Hälfte der Parameter aus. Die Adaption erfolgt genau wie für das ursprüngliche Regelgesetz, wobei ξ durch ξ' zu ersetzen ist.

Die Rechenzeiteffizienz kann erhöht werden, indem nicht alle Basisfunktionen ξ⁺ und ξ⁻ berechnet werden. Dies ist möglich, wenn die Aufteilung der Basisfunktionen entlang einer (Hyper-)ebene orthogonal zu einer Achse des Eingangsgrößenraumes erfolgt (d. h. beispielsweise x₁ = 0 als Trennungsebene). Dann sind nämlich die meisten Basisfunktionen auf einer Seite der Trennungsebene gleich Null (oder bei Funktionen, die nicht den Wert Null annehmen - wie z. B. radiale Gaußsche Basisfunktionen - vernachlässigbar klein). Lediglich Basisfunktionen, deren Zentren in der Nähe oder auf der Trennungsebene liegen, sind auf beiden Seiten der Trennungsebene von Null verschieden. Ersetzt man nun vor Berechnung der Basisfunktionen x₁ durch |x₁| (es wird davon ausgegangen, daß x₁ = 0 die Trennungsebene ist und die Basisfunktionen ξ +|k auf der Seite x₁ < 0 liegen), so sind die meisten Basisfunktionen ξ -|k konstant Null oder sehr klein und können bei der Berechnung weggelassen werden; d. h. die Berechnung von ξ' vereinfacht sich erheblich. Um die Betragsbildung von x₁ wieder auszugleichen, muß die berechnete Stellgröße mit dem Vorzeichen von x₁ multipliziert werden.

Für die Regelgesetze (4) und (6) ist die Ausnutzung der Symmetrie nach demselben Prinzip möglich.

Bei Regelgesetz (4) erfolgt die Aufteilung getrennt für die Basisfunktionsvektoren ξ ₁(w, x) und ξ ₂(x). Bei Regelgesetz (6) erfolgt die Aufteilung getrennt für die Basisfunktionsvektoren ξ ₁ = [ξ T|1,1(x) . f*_k1,1(x), ξ T|1,2(x) . f*_k1,2(x), . . .]^T und ξ ₂ = [ξ T|2,1(x) . f*_k2,1(x), ξ T|2,2(x) . f*_k2,2(x), . . .]^T. Dabei sind die unterschiedlichen Symmetrieeigenschaften der bekannten Teilfunktionen f*_ki,j(x) zu beachten: es kann entweder gelten f*_ki,j(x) = f*_ki,j(-x) oder f*_ki,j(x) = -f*_ki,j(-x). Für die kombinierten Basisfunktionsvektoren ξ ₁ und ξ ₂ gilt also:

Für die Parameter gilt entsprechend θ +|k = -v_kθ -|k; das modifizierte Regelgesetz wird folglich mit θ' = θ⁺ und ξ' = ξ⁺ - Vξ⁻, V = diag(v_k) gebildet. (Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Dar stellungsweisen, die dasselbe Grundprinzip realisieren.)

2.1.4 Adaptionsgesetz ohne Differentiation der Regelgröße

Um im weiteren die Formeln zu vereinfachen, soll folgende Schreibweise vereinbart werden: Ist z(t) ein zeitabhängiges Signal, so wird mit z_f(t) dasjenige Signal bezeichnet, welches aus z(t) durch die lineare Filterung

entsteht.

Unter Verwendung dieser Schreibweise lautet das Adaptionsgesetz mit erweitertem Fehler für das Re gelgesetz (3)

Dabei sind γ < 0 und

die Adaptionsverstärkungen und e* der erweiterte Fehler (s. J. Slotine und W. Li, Applied Nonlinear Control); der erweiterte Fehler ist definiert als

mit dem Hilfsfehler

_p und u_aux sind Hilfssignale, die aus folgendem Grund benötigt werden: Zur Berechnung des erweiterten Fehlers (10) ist ein Schätzwert für die Streckenverstärkung L_gL n-1|fh(x) (im weiteren kurz als k_p bezeichnet) erforderlich. Dieser Wert ist jedoch bei dem verwendeten Regelgesetz nicht explizit verfügbar, sondern impli zit in f_c(w, x, θ) enthalten; daher muß k_p durch einen internen Hilfsparameter _p geschätzt werden. Für die Adaption von _p wird das Hilfssignal u_aux benötigt, welches gemäß folgenden Gleichungen in Referenzmodell und Regelgesetz eingespeist wird:

Für den Stabilitätsbeweis wird zunächst folgender Hilfssatz benötigt:

Hilfssatz 1

Gegeben sei eine SISO-Strecke der Form

deren relativer Grad r gleich ihrer Ordnung n ist (Der relative Grad ist definiert als die Ordnung der niedrigsten Ableitung von y, die direkt von der Eingangsgröße u abhängt (s. J. Slotine und W. Li, Applied Nonlinear Control). Für lineare Systeme ist dies gleichbedeutend mit der bekannten Definition "Anzahl der Pole minus Anzahl der Nullstellen"), sowie ein lineares Referenzmodell

der Ordnung n mit dem Zählergrad Null. Existieren in einem bestimmten Bereich des Zustandsraumes die Lie-Ableitungen L n|fh(x) und L_gL n-1|fh(x) und ist in dem betreffenden Bereich L_gL n-1|fh(x) = const. ≠ 0, so führt das Regelgesetz

für diesen Bereich des Zustandsraumes zu der Fehlerdifferentialgleichung

Der Beweis dieses Hilfssatzes beruht auf der Theorie der Input-Output-Linearisierung (s. J. Slotine und W. Li, Applied Nonlinear Control) und soll hier nicht weiter ausgeführt werden.

Der folgende Satz stellt für das Adaptionsgesetz (8)-(9) die Stabilität sicher:

Satz 1

Gegeben sei ein adaptives System aus einer Strecke vom Typ (14)-(15), einem Referenzmodell nach Gl. (12), einem adaptiven Fuzzy-Regler nach Gl. (13) und dem Adaptionsgesetz (8)-(9). Dann gilt:

1. Wenn der inhärente Approximationsfehler d hinreichend klein ist, so sind der Parametervektor θ und der Hilfsparameter _p beschränkt.
2. Wenn d ∼ 0 ist und ξ und u_aux beschränkt sind, so ist lim_t→∞ e = 0.

Beweis von Satz 1

Unter Verwendung von Hilfssatz 1 erhält man für das beschriebene System folgende Differentialgleichung für den Fehler e:

d. h.

Für den erweiterten Fehler e* ergibt sich

hierbei ist der erweiterte Parameterfehler

und der erweiterte Aktivierungsvektor

Aus dem Adaptionsgesetz (8)-(9) ergibt sich

mit

Zum Nachweis der Beschränktheit von

wird die Ljapunow-Funktion

verwendet. Ihre Ableitung nach der Zeit ist

Ist d hinreichend klein, so ist ≦ 0; damit ist die Beschränktheit von

und somit die Beschränktheit von θ und _p nachgewiesen.

Um zu zeigen, daß lim_t→∞ e = 0 ist, wird zunächst bewiesen, daß lim_t→∞ e* = 0 ist. (Im folgenden wird von d ∼ 0 ausgegangen.) Hierzu wird die zweite Ableitung von V berechnet:

Aus der Beschränktheit von ξ und u_aux (s. Voraussetzung) und der Beschränktheit von

folgt die Be schränktheit von

und damit die Beschränktheit von . Aus dem Lemma von Barbalat (s. J. Slotine und W. Li, Applied Nonlinear Control) folgt nun aber, daß dann lim_t→∞ = lim_t→∞(-e^*2) = 0 sein muß. Damit ist auch lim_t→∞ e^* = 0.

Als nächster Schritt wird lim_t→∞ e_aux = 0 bewiesen. In K. Narendra und A. Annaswamy, Siable Adaptive Systems, wird gezeigt, daß dies der Fall ist, wenn ξ beschränkt und

quadratisch integrierbar ist. Die quadratische Integrierbarkeit von

ergibt sich aus

Somit ist e^* quadratisch integrierbar; da

und ξ _f beschränkt ist, ist auch

quadratisch inte grierbar. Damit ist nachgewiesen, daß lim_t→∞ e_aux = 0 ist.

Schließlich kann mit derselben Argumentation gezeigt werden, daß auch lim_t→∞((_p u_aux)_f - _pu_auxf) = 0 ist. Mit (10) folgt aus diesen Teilergebnissen lim_t→∞ e = 0, womit Satz 1 bewiesen ist.

Für das Regelgesetz (4) lautet das entsprechende Adaptionsgesetz

mit

Der Hilfsparameter _p und das Hilfssignal u_aux können hier entfallen. Die Adaption von θ ₂ ist bei Unter schreiten einer vorgegebenen unteren Schranke anzuhalten, um eine Division durch Null im Regelgesetz zu verhindern.

Für das Regelgesetz (6) lautet das Adaptionsgesetz

mit

(Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)

2.1.5 Berücksichtigung der Stellgrößenbegrenzung

Ein weiteres Problem der stabilen adaptiven Fuzzy-Regelung bestand bislang darin, daß sie auf Strecken mit Stellgrößenbegrenzung nicht anwendbar war. Die Herleitung des Verfahrens geht davon aus, daß beliebig hohe Stellamplituden möglich sind; Simulationen zeigen, daß das Vorhandensein einer Stellgrößenbegrenzung zu Instabilität (d. h. unbeschränktem Anwachsen der zu adaptierenden Parameter) führt. Das resultieren de Regelungsverhalten ist durch ständiges Hin- und Herschalten der Stellgröße zwischen positiver und negativer Begrenzung gekennzeichnet. Auch dieses Problem konnte jedoch durch eine Weiterentwicklung des Adaptionsgesetzes gelöst werden. Die Modifikation beruht im wesentlichen auf einer Abschaltung der Adaption während der Begrenzungsphase sowie der Verwendung eines modifizierten Referenzsignals. Das Adaptionsgesetz (8) wird modifiziert zu

das Adaptionsgesetz (9) wird entsprechend modifiziert. Die Bedingung (ue*ξ _f < 0 ∧ |e| < ε_e) wird benötigt, um ein "Hängenbleiben" in der Stellgrößenbegrenzung zu verhindern, falls alle aktiven Parameter durch Überschwingen < u_max (oder < -u_max) werden sollten. In diesem Fall wird der Fehler irgendwann < ε_e, und die Parameter verlassen die Begrenzung wieder. Theoretisch könnte ε_e, auf Null gesetzt werden; Simulationsergebnisse haben jedoch gezeigt, daß ein Wert von ε_e = (0.1 . . . 1.0) . max(|y_m(t)|) zu einem besseren Verhalten der Parameter führt. Wird ε_e zu Null gesetzt, ist die Adaption für Parameter, die von der Begrenzung betroffen sind, "unsymmetrisch" (Adaption zu Null hin ist möglich, während Adaption von Null weg während der Begrenzung nicht möglich ist); dies führt in Verbindung mit dem inhärenten Approximationsfehler zu oszillatorischem Verhalten der Parameter.

Weiterhin muß zur Erreichung stabilen Verhaltens ein modifiziertes Referenzsignal y_mm eingeführt wer den. Das modifizierte Referenzmodell hat die gleiche Dynamik wie das ursprüngliche Modell, aber seine Zustände y_mm, _mm, _mm, . . . y (n-1)|mm werden auf y, , , . . . y^(n-1) zurückgesetzt, wenn u die Begrenzung verläßt (In der Praxis wird das Referenzmodell zeitdiskret realisiert. Wenn u die Begrenzung verläßt, werden seine Zustände y_mm(k) . . . y_mm(k - n + 1) auf y(k) . . . y(k - n + 1) zurückgesetzt. Es ist also keine Differentiation von y erforderlich). Gleichzeitig werden die Zustände der linearen Filter für ξ _f und (θ ^T ξ)_f auf Null zurückgesetzt. (Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)

2.2 Anwendung des Verfahrens auf die Regelung von elektrischen Antriebssystemen mit schwingungsfähiger Mechanik und nichtlinearer Reibungskennlinie

Im folgenden soll nun die Funktionsweise des beschriebenen Verfahrens an einem Anwendungsbeispiel ver deutlicht werden. Als unbekannte nichtlineare Strecke wurde ein Antriebssystem mit nichtlinearer Reibung verwendet (Abb. 2). Das Antriebssystem stellt einen Zwei-Massen-Torsionsschwinger dar. Die zu regeln de Ausgangsgröße ist die Drehzahl der Lastmasse x₁; die weiteren Zustandsgrößen sind der Verdrehwinkel der Welle x₂ und die Motordrehzahl x₃. Auf die Motormasse wirkt als Stellgröße das Luftspaltmoment u (Annahme: ideale Momentenregelung); der Betrag von u ist auf den Maximalwert u_max = 5,0 begrenzt. Auf die Lastmasse wirkt ein Reibmoment f_f(x₁), welches nichtlinear von der Lastdrehzahl x₁ abhängt. Die Reibungskennlinie wurde durch die Arcustangens-Funktion modelliert. Die Torsionseigenfrequenz beträgt ca. 50 Hz; die Dämpfung der Welle wurde zu Null angenommen.

Der Entwurf des Referenzmodells erfolgte nach der Methode der Doppelverhältnisse; die Ersatzzeitkon stante des Referenzmodells wurde zu T_m = 20 ms vorgegeben.

Unter Ausnutzung des Vorwissens, daß die nichtlineare Reibung nur von x₁, aber nicht von x₂ und x₃ abhängt, wurde ein Regelgesetz der Form

aufgestellt, bei dem alle unbekannten nichtlinearen Funktionen nur noch von x₁ abhängen. Für jede der unbekannten nichtlinearen Teilfunktionen wurde ein Funktionsapproximator mit 10 dreieckförmigen Basis funktionen verwendet.

Simulationsergebnisse für diesen Regler sind in Abb. 3 zu sehen. Der Regler wird durch Aufschalten eines Sollwertsignals w(t) trainiert, das alle 40 ms einen neuen Zufallswert im Bereich [-0,5, 0,5] annimmt. Nach 300, 1800 und 7200 s wird ein dreieckförmiges Testsignal aufgeschaltet, um das erreichte Lernergebnis zu beurteilen.

Um zu demonstrieren, daß Stabilität und Konvergenz unabhängig von den Anfangsbedingungen sind, werden die Parametervektoren θ ₂, θ ₃, θ ₄ und θ ₅ aus (38) auf Null initialisiert; θ₁ wird auf den Anfangswert 10⁶ gesetzt. Es wird also keinerlei Vorwissen über die Parameter der Strecke zugrundegelegt. Zu Beginn der Adaption ist das Regelgesetz also

es erfolgt somit lediglich eine Steuerung mit dem Sollwert w. Wie bereits erwähnt, geht der Adaptions vorgang in der Anfangsphase relativ schnell vonstatten. Nach ca. 300 s folgt die Lastdrehzahl bereits grob dem Referenzsignal y_m. Danach wird die Adaption jedoch wesentlich langsamer. Auch nach 1800 s sind - besonders im Bereich kleinerer Drehzahlen - noch deutliche Abweichungen zwischen y und y_m zu erkennen. Nach ca. 7200 s (d. h. zwei Stunden) sind Lastdrehzahl und Referenzsignal für den dreieckförmigen Sollwert verlauf praktisch deckungsgleich. Die verbleibenden Abweichungen bei zufallsverteiltem Sollwertverlauf sind auf die Stellgrößenbegrenzung zurückzuführen. Die Adaption wird bei Erreichen der Stellgrößenbegrenzung angehalten (s. 2.1.5); wie man sieht, bleiben durch diese Maßnahme Stabilität und Konvergenz erhalten, obwohl die Stellgrößenbegrenzung (aufgrund der schnellen Einstellung des Referenzmodells) bei fast jedem Sollwertsprung erreicht wird.

Claims

1. Verfahren zur stabilen direkten adaptiven Regelung nichtlinearer Strecken mit nicht exakt bekann ter Struktur und nicht exakt bekannten Parametern, dadurch gekennzeichnet, daß das Regelgesetz einen oder mehrere universelle nichtlineare Funktionsapproximatoren mit lokalisierten Basisfunktionen enthält und daß die Parameter dieser Funktionsapproximatoren durch ein Adaptionsgesetz eingestellt werden, in dem die Zeitverläufe der Basisfunktionen nach dem Prinzip des erweiterten Fehlers verarbei tet werden, wodurch eine Differentiation der Regelgröße entfällt. Als universelle nichtlineare Funktions approximatoren mit lokalisierten Basisfunktionen können dabei alle Verfahren zum Einsatz kommen, bei denen der Approximationswert durch skalare Multiplikation eines Vektors von einstellbaren Para metern mit einem Vektor von im Eingangsgrößenraum angeordneten Basisfunktionen berechnet wird, wobei jede Basisfunktion nur in einem bestimmten Bereich des Eingangsgrößenraumes wesentlich von Null verschieden ist. Hierzu gehören neuronale Netze mit radialen Basisfunktionen, allgemeine neuro nale Regressionsnetzwerke sowie Fuzzy-Regler, deren Defuzzyfizierung nach dem Singleton-Verfahren erfolgt (Verfahren nach Abschnitt 2.1.4 oder vergleichbares Verfahren).

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Regler als Eingangsgrößen den Sollwert und alle Zustandsgrößen der Strecke, jedoch keine Ableitungen der Regelgröße erhält. Die Regler struktur besteht entweder aus einem universellen nichtlinearen Funktionsapproximator, dem die Reg lereingangsgrößen zugeführt werden und der direkt die Stellgröße berechnet, oder aus zwei universellen nichtlinearen Funktionsapproximatoren, denen die Reglereingangsgrößen zugeführt werden und deren Ausgangsgrößen zur Ermittlung der Stellgröße dividiert werden (Verfahren nach Abschnitt 2.1.1 oder vergleichbares Verfahren).

3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß aufgrund von Vorwissen eine Aufteilung des Regelgesetzes in mehrere Teilfunktionen erfolgt, von denen einige im voraus bekannt sind und bei den übrigen im voraus bekannt ist, von welchen Reglereingangsgrößen sie abhängen. Das Regelgesetz besteht aus den bekannten Teilfunktionen sowie universellen nichtlinearen Funktionsapproximatoren, welche die unbekannten Teilfunktionen erlernen. Dabei werden diesen Funktionsapproximatoren nicht alle Reglereingangsgrößen zugeführt, sondern nur diejenigen, von denen die entsprechenden unbekann ten Teilfunktionen wirklich abhängen (Verfahren nach Abschnitt 2.1.2 oder vergleichbares Verfahren).

4. Verfahren nach Anspruch 1-3, dadurch gekennzeichnet, daß durch Ausnutzung von Symmetrie eigenschaften die Anzahl der adaptierten Parameter und damit auch die benötigte Lernzeit sowie der Rechenzeit- und Speicherplatzbedarf verringert wird. Dies erfolgt durch eine geeignete Zusam menfassung von je zwei Parametern bzw. den zwei zugehörigen Basisfunktionen, so daß jeweils zwei Parameter zusammengefaßt werden, die aufgrund der Symmetrieeigenschaften gegen denselben Wert bzw. denselben Wert mit umgekehrtem Vorzeichen konvergieren (Verfahren nach Abschnitt 2.1.3 oder vergleichbares Verfahren).

5. Verfahren nach Anspruch 1-4, dadurch gekennzeichnet, daß keine Adaption der Parameter statt findet, solange sich die Stellgröße an der Begrenzung befindet, und daß bei Verlassen der Stellgrößen begrenzung der Zustand des Referenzmodells auf den Streckenzustand zurückgesetzt wird (Verfahren nach Abschnitt 2.1.5 oder vergleichbares Verfahren).