DE19641066A1 - Verfahren zur direkten adaptiven Regelung nichtlinearer Strecken - Google Patents
Verfahren zur direkten adaptiven Regelung nichtlinearer StreckenInfo
- Publication number
- DE19641066A1 DE19641066A1 DE1996141066 DE19641066A DE19641066A1 DE 19641066 A1 DE19641066 A1 DE 19641066A1 DE 1996141066 DE1996141066 DE 1996141066 DE 19641066 A DE19641066 A DE 19641066A DE 19641066 A1 DE19641066 A1 DE 19641066A1
- Authority
- DE
- Germany
- Prior art keywords
- parameters
- law
- functions
- basic functions
- adaptation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 57
- 230000006870 function Effects 0.000 claims description 46
- 230000006978 adaptation Effects 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 230000008901 benefit Effects 0.000 claims description 6
- 230000004069 differentiation Effects 0.000 claims description 5
- 238000012886 linear function Methods 0.000 claims description 4
- 230000001537 neural effect Effects 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 9
- 230000006399 behavior Effects 0.000 description 6
- 238000000926 separation method Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003534 oscillatory effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- URWAJWIAIPFPJE-YFMIWBNJSA-N sisomycin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H](CC=C(CN)O2)N)[C@@H](N)C[C@H]1N URWAJWIAIPFPJE-YFMIWBNJSA-N 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/0275—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using fuzzy logic only
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Description
Bei industriellen Anwendungen der Regelungstechnik sind häufig Strecken zu regeln, welche durch ausge
prägte Nichtlinearitäten gekennzeichnet sind und bei denen weiterhin Parameter und Struktur nicht exakt
bekannt sind. Zur Regelung solcher Strecken dienen adaptive nichtlineare Regelungsverfahren. Diese lassen
sich zunächst einteilen in Verfahren, die auf eine bestimmte Streckenstruktur zugeschnitten sind, und weit
gehend universell einsetzbare Verfahren. Zur zweiten Klasse gehören Regelungsverfahren mit neuronalen
Netzen sowie adaptive Fuzzy-Regler. Bei den meisten dieser Verfahren ist über die Stabilität und Konver
genz des Gesamtsystems aus Strecke, Regler und Adaptionsgesetz keine Aussage möglich; daher können
diese Verfahren nur zur Regelung von Strecken eingesetzt werden, die nicht stabilitätskritisch sind, und es
sind zusätzliche Überwachungsmaßnahmen erforderlich. Bei einer Reihe von Verfahren ist dagegen ein Sta
bilitätsbeweis möglich. Hierbei ist zu unterscheiden zwischen indirekten Verfahren, bei denen zunächst eine
Identifikation der Strecke und darauf abgestimmt die Regelung aufgrund des identifizierten Streckenmodells
erfolgt; bei direkten Verfahren, wird dagegen der Regler direkt adaptiert, um ein vorgegebenes Verhalten
des Regelkreises zu erreichen. Während bei indirekten Verfahren ein Stabilitätsbeweis i.a. nur für das Teil
system Strecke - Identifikationsmodell - Adaptionsgesetz möglich ist, kann bei direkten Verfahren Stabilität
für das Gesamtsystem aus Strecke, Regler und Adaptionsgesetz bewiesen werden. Es wurde bislang bereits
eine Reihe solcher Verfahren veröffentlicht: Tzirkel, E., and Fallside, F., A Direct Control Method for a
Class of Nonlinear Systems Using Neutral Networks, Technical Report, Cambridge University Engineering
Department, Cambridge, 1993; E. Tzirkel-Hancock and F. Fallside, Stable Control of Nonlinear Systems
Using Neural Networks, Int. J. Robust and Nonlinear Control, Vol. 2, no. 1, 1992; Robert M. Sanner and
Jean-Jacques E. Slotine, Gaussian Networks for Direct Adaptive Control, IEEE Transactions on Neural
Networks, Vol. 3, no. 6, 1992; Clemens Schäffner and Dierk Schröder, An Application of General Regres
sion Neural Network to Nonlinear Adaptive Control, 5th European Conference on Power Electronics and
Applications (EPE), Vol. 4, Brighton, 1993; Clemens Schäffner, Analyse und Synthese neuronaler Regelungs
verfahren, Dissertation, Technische Universität München, Lehrstuhl für elektrische Antriebstechnik, 1996;
Li-Xin Wang, Slable Adaptive Fuzzy Control of Nonlinear Systems, IEEE Transactions on Fuzzy Systems,
Vol. 1, 1993.
Diese Regelungsverfahren basieren auf der Grundstruktur nach Abb. 1, wobei statt des Fuzzy-Reglers
auch genausogut ein neuronales Netz als nichtlinearer Funktionsapproximator eingesetzt werden kann. Gege
ben ist eine nichtlineare Strecke bekannter Ordnung, deren Struktur und Parameter jedoch völlig unbekannt
oder nur zum Teil bekannt sind, sowie ein Referenzmodell, welches das gewünschte Führungsverhalten des
geschlossenen Regelkreises vorgibt. Das Referenzmodell ist so zu gestalten, daß die physikalischen Gege
benheiten der realen nichtlinearen Strecke und des Stellgliedes berücksichtigt werden. Die Strecke ist so zu
regeln, daß ihre Ausgangsgröße y dem Referenzsignal ym folgt. u ist die Stellgröße, x der Zustandsvektor
der Strecke, n die Ordnung der Strecke und e = y-ym der Ausgangsfehler. Das Regelgesetz ist von der
Form
hierbei stellen die Ausdrücke θ T|1ξ(x) und θ T|2ξ(x) universelle nichtlineare Funktionsapproximatoren dar, also
z. B. neuronale Netze mit radialen Basisfunktionen oder adaptive Fuzzy-Regler (s. u.). Die Parametervektoren
dieser Funktionsapproximatoren werden durch ein Adaptionsgesetz der Form
eingestellt. Dabei ist γ die Adaptionsverstärkung. Mit Hilfe der Stabilitätstheorie von Ljapunow kann nun
gezeigt werden, daß das Gesamtsystem stabil ist und der Fehler e gegen Null konvergiert, wenn die Strecke
und die Eingangssignale gewissen Bedingungen genügen und die Koeffizienten p1 . . . pn die sog. Ljapunow-
Gleichung erfüllen.
Die bislang veröffentlichten Verfahren weisen jedoch eine Reihe von Nachteilen auf, die einer breiten
praktischen Anwendung entgegenstehen bzw. diese praktisch verhindern:
- - Sowohl für das Regelgesetz als auch für das Adaptionsgesetz werden n-1 Ableitungen der Regelgröße benötigt (n = Ordnung der Strecke); in der Praxis ist dies jedoch aufgrund der immer vorhandenen Meßstörungen im allgemeinen nicht realisierbar.
- - Die Verfahren funktionieren nicht bei Vorhandensein einer Stellgrößenbegrenzung; das Vorhandensein einer solchen Begrenzung bewirkt i.a. eine Divergenz der adaptierten Parameter, d. h. Instabilität. In der Praxis sind jedoch bei keiner Strecke unbegrenzte Stellgrößen möglich; in den meisten Fällen ist die Stellgröße soweit begrenzt, daß die Begrenzung auch in real vorkommenden Betriebszuständen erreicht wird.
- - Rechenzeit- und Speicherplatzbedarf wachsen exponentiell mit der Ordnung der Strecke an. Auch die Zeit bis zum Erlernen des gewünschten Regelgesetzes wächst stark mit der Ordnung der Strecke an und ist generell relativ groß. Diese Zeit ergibt sich aus der Dynamik des Gesamtsystems aus Strecke, Regler und Adaptionsgesetz und hängt von zahlreichen Einflußfaktoren ab; bereits für relativ einfache Strecken dritter Ordnung kann sie bei mehreren Tagen liegen, was in der Praxis nicht tolerierbar ist.
Im folgenden Abschnitt wird ein verbessertes adaptives nichtlineares direktes Regelungsverfahren be
schrieben, welches diese Nachteile behebt.
Dem Verfahren liegt wieder die Systemstruktur nach Abb. 1 zugrunde. Die Strecke ist so zu regeln, daß
ihre Ausgangsgröße y dem Referenzsignal ym folgt. Für eine bestimmte Klasse von Strecken und Refe
renzmodellen kann mittels des Ansatzes der Input-Output-Linearisierung (s. J. Slotine und W. Li, Applied
Nonlinear Control) gezeigt werden, daß ein Regelgesetz existiert, welches diese Aufgabe erfüllt. Dieses "idea
le" Regelgesetz kann aber nicht explizit berechnet werden, da die Strecke unbekannt ist; daher werden zu
seiner Ermittlung Methoden der künstlichen Intelligenz eingesetzt. Hierfür kommen alle Verfahren in Frage,
die zum Erlernen statischer nichtlinearer Funktionen geeignet sind, also Radial-Basis-Function-Netzwerke
(s. Tzirkel, E., and Fallside, F., A Direct Control Method for a Class of Nonlinear Systems Using Neural
Networks, und Robert M. Sanner and Jean-Jacques E. Slotine, Gaussian Networks for Dired Adaptive Con
trol), General-Regression-Netzwerke (s. Clemens Schäffner and Dierk Schröder, An Application of General
Regression Neural Network to Nonlinear Adaptive Control) oder adaptive Fuzzy-Regler (s. Li-Xin Wang,
Stable Adaptive Fuzzy Control of Nonlinear Systems). Das Grundprinzip bleibt bei allen genannten Verfah
ren gleich; der Einsatz eines Fuzzy-Reglers hat dabei den Vorteil, daß das Regelgesetz nicht als "black box",
sondern in Form anschaulicher WENN-DANN-Regeln vorliegt. Dies ist besonders nützlich, wenn verbal
formuliertes Vorwissen zur Initialisierung des Reglers genutzt werden soll. In den folgenden Ausführungen
soll deshalb der Ansatz unter Verwendung von Fuzzy-Reglern dargestellt werden; dies soll aber nur als
Beispiel dienen und bedeutet keine Beschränkung der vorgestellten Verfahren auf die Fuzzy-Regelung, d. h.
es können auch die anderen Methoden verwendet werden.
Das Regelgesetz zur Berechnung der Stellgröße u aus dem Sollwert w und dem Zustandsvektor x kann
unterschiedliche Formen besitzen. Die einfachste Form ist
hierbei ist θ T ξ(w, x) ein universeller nichtlinearer Funktionsapproximator, z. B. ein neuronales Netzwerk
mit radialen Basisfunktionen, ein allgemeines neuronales Regressionsnetzwerk oder ein bestimmter Typ von
Fuzzy-Regler (s. Li-Xin Wang, Stable Adaptive Fuzzy Control of Nonlinear Systems). Der Vektor θ enthält
die einstellbaren Parameter des Funktionsapproximators, der Vektor ξ enthält lokalisierte Basisfunktionen,
von denen jede in einem begrenzten Bereich des Eingangsgrößenraumes zur Approximation beiträgt, im
übrigen Eingangsgrößenraum dagegen Null oder näherungsweise Null ist.
Dieses Regelgesetz ist nur für Strecken einsetzbar, bei denen die Lie-Ableitung LgL n-1|fh(x) (s. u.) kon
stant ist. Ist LgL n-1|fh(x) nicht konstant, findet das Regelgesetz
Anwendung. Im Gegensatz zu Regelgesetzen der Form (1) benötigen diese Regelgesetze keine Differentiation
des Fehlers e und damit der Regelgröße y. Ihre Einsetzbarkeit beruht auf dem Hilfssatz 1. (Die hier ange
gebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen.
Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische
Darstellungsweisen, die dasselbe Grundprinzip realisieren.)
Bei den beiden soeben genannten Regelgesetzen ist die Stellgröße eine allgemeine nichtlineare Funktion aller
Reglereingangsgrößen. Daher werden universelle Funktionsapproximatoren benötigt, welche alle Reglerein
gangsgrößen als Eingangsgrößen besitzen. Dies führt bei Strecken höherer Ordnung zu Problemen mit dem
Rechenzeit- und Speicherplatzbedarf sowie der Lernzeit. Eine mögliche Lösung besteht darin, das Regelge
setz in lineare und nichtlineare Teilfunktionen aufzuteilen, die dann getrennt erlernt werden können. Eine
solche Aufteilung kann aufgrund von Vorwissen über die Streckenstruktur vorgenommen werden. In vielen
Fällen ist es möglich, die Differentialgleichungen der Strecke in bekannte und unbekannte Teilfunktionen
aufzuteilen. Für dieses teilweise bekannte Streckenmodell kann dann über die Lie-Ableitungen das ideale
Regelgesetz berechnet werden. Es hat die allgemeine Form (vgl. Hilfssatz 1)
wobei die Teilfunktionen f*ki,j(x) bekannt und die Teilfunktionen f*ui,j(x) unbekannt sind. b1m ist der erste
Zählerkoeffizient des Referenzmodells. Der wesentliche Vorteil besteht nun darin, daß i.a. die unbekannten
Teilfunktionen f*ui,j(x) nicht von allen Reglereingangsgrößen abhängen, sondern nur von einigen bestimm
ten Eingangsgrößen. Welche Teilfunktionen von welchen Eingangsgrößen abhängen, ist im voraus bekannt.
Dieses Vorwissen wird zur Aufstellung des Regelgesetzes
verwendet. Der Vorteil besteht nun darin, daß auch hier die unbekannten nichtlinearen Teilfunktionen
θ T|i,jξ i,j(x) nicht von allen Reglereingangsgrößen abhängen. Dadurch haben die Basisfunktionen eine niedri
gere Dimension, und es werden insgesamt weniger Parameter benötigt (s. Beispiel in Abschnitt 2.2). (Die
hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens ver
deutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere
mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)
Eine Reduktion der Parameteranzahl - und damit von Rechenzeit- und Speicherplatzbedarf sowie Lernzeit-
kann durch Ausnutzung von Symmetrieeigenschaften erreicht werden. Die Dynamik vieler Strecken weist
(näherungsweise) Symmetrieeigenschaften zum Punkt
aus denen folgt, daß
ist. Folglich ist alle Information, die zur
Beschreibung des Regelgesetzes erforderlich ist, in der Hälfte des Parametervektors enthalten. Um dies
auszunutzen, werden auch die Basisfunktionen
des nichtlinearen Funktionsapproximators symmetrisch
zum Punkt
angeordnet. Der Basisfunktionsvektor ξ wird in zwei gleich große Untervektoren ξ ⁺ und
ξ ⁻ unterteilt, so daß gilt:
(Liegt eine Basisfunktion genau symmetrisch zum Punkt
so muß der zugehörige Parameter Null sein; daher kann diese Basisfunktion weggelassen werden.) Wird nun
der Parametervektor θ ebenfalls in zwei entsprechende Untervektoren θ⁺ und θ⁻ aufgeteilt, kann ein neues
Regelgesetz als u' = θ' T ξ' mit θ' = θ⁺ und ξ' = ξ⁺ - ξ⁻ geschrieben werden. Da θ⁺ = -θ⁻ ist (aufgrund der
Symmetrie von fc), ergibt sich u' = u. Das neue Regelgesetz liefert also die gleiche Stellgröße wie (3), kommt
aber mit der Hälfte der Parameter aus. Die Adaption erfolgt genau wie für das ursprüngliche Regelgesetz,
wobei ξ durch ξ' zu ersetzen ist.
Die Rechenzeiteffizienz kann erhöht werden, indem nicht alle Basisfunktionen ξ⁺ und ξ⁻ berechnet
werden. Dies ist möglich, wenn die Aufteilung der Basisfunktionen entlang einer (Hyper-)ebene orthogonal
zu einer Achse des Eingangsgrößenraumes erfolgt (d. h. beispielsweise x1 = 0 als Trennungsebene). Dann sind
nämlich die meisten Basisfunktionen auf einer Seite der Trennungsebene gleich Null (oder bei Funktionen,
die nicht den Wert Null annehmen - wie z. B. radiale Gaußsche Basisfunktionen - vernachlässigbar klein).
Lediglich Basisfunktionen, deren Zentren in der Nähe oder auf der Trennungsebene liegen, sind auf beiden
Seiten der Trennungsebene von Null verschieden. Ersetzt man nun vor Berechnung der Basisfunktionen x1
durch |x1| (es wird davon ausgegangen, daß x1 = 0 die Trennungsebene ist und die Basisfunktionen ξ +|k
auf der Seite x1 < 0 liegen), so sind die meisten Basisfunktionen ξ -|k konstant Null oder sehr klein und
können bei der Berechnung weggelassen werden; d. h. die Berechnung von ξ' vereinfacht sich erheblich. Um
die Betragsbildung von x1 wieder auszugleichen, muß die berechnete Stellgröße mit dem Vorzeichen von x1
multipliziert werden.
Für die Regelgesetze (4) und (6) ist die Ausnutzung der Symmetrie nach demselben Prinzip möglich.
Bei Regelgesetz (4) erfolgt die Aufteilung getrennt für die Basisfunktionsvektoren ξ 1(w, x) und ξ 2(x). Bei
Regelgesetz (6) erfolgt die Aufteilung getrennt für die Basisfunktionsvektoren ξ 1 = [ξ T|1,1(x) . f*k1,1(x), ξ T|1,2(x) .
f*k1,2(x), . . .]T und ξ 2 = [ξ T|2,1(x) . f*k2,1(x), ξ T|2,2(x) . f*k2,2(x), . . .]T. Dabei sind die unterschiedlichen Symmetrieeigenschaften
der bekannten Teilfunktionen f*ki,j(x) zu beachten: es kann entweder gelten f*ki,j(x) =
f*ki,j(-x) oder f*ki,j(x) = -f*ki,j(-x). Für die kombinierten Basisfunktionsvektoren ξ 1 und ξ 2 gilt also:
Für die Parameter gilt entsprechend θ +|k = -vkθ -|k; das modifizierte
Regelgesetz wird folglich mit θ' = θ⁺ und ξ' = ξ⁺ - Vξ⁻, V = diag(vk) gebildet. (Die hier angegebenen
mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die
praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Dar
stellungsweisen, die dasselbe Grundprinzip realisieren.)
Um im weiteren die Formeln zu vereinfachen, soll folgende Schreibweise vereinbart werden: Ist z(t) ein
zeitabhängiges Signal, so wird mit zf(t) dasjenige Signal bezeichnet, welches aus z(t) durch die lineare
Filterung
entsteht.
Unter Verwendung dieser Schreibweise lautet das Adaptionsgesetz mit erweitertem Fehler für das Re
gelgesetz (3)
Dabei sind γ < 0 und
die Adaptionsverstärkungen und e* der erweiterte Fehler (s. J. Slotine und
W. Li, Applied Nonlinear Control); der erweiterte Fehler ist definiert als
mit dem Hilfsfehler
p und uaux sind Hilfssignale, die aus folgendem Grund benötigt werden: Zur Berechnung des erweiterten
Fehlers (10) ist ein Schätzwert für die Streckenverstärkung LgL n-1|fh(x) (im weiteren kurz als kp bezeichnet)
erforderlich. Dieser Wert ist jedoch bei dem verwendeten Regelgesetz nicht explizit verfügbar, sondern impli
zit in fc(w, x, θ) enthalten; daher muß kp durch einen internen Hilfsparameter p geschätzt werden. Für die
Adaption von p wird das Hilfssignal uaux benötigt, welches gemäß folgenden Gleichungen in Referenzmodell
und Regelgesetz eingespeist wird:
Für den Stabilitätsbeweis wird zunächst folgender Hilfssatz benötigt:
Gegeben sei eine SISO-Strecke der Form
deren relativer Grad r gleich ihrer Ordnung n ist (Der relative Grad ist definiert als die Ordnung der niedrigsten Ableitung von y, die direkt von der Eingangsgröße u abhängt
(s. J. Slotine und W. Li, Applied Nonlinear Control). Für lineare Systeme ist dies gleichbedeutend mit der bekannten Definition
"Anzahl der Pole minus Anzahl der Nullstellen"), sowie ein lineares Referenzmodell
der Ordnung n mit dem Zählergrad Null. Existieren in einem bestimmten Bereich des Zustandsraumes die
Lie-Ableitungen L n|fh(x) und LgL n-1|fh(x) und ist in dem betreffenden Bereich LgL n-1|fh(x) = const. ≠ 0,
so führt das Regelgesetz
für diesen Bereich des Zustandsraumes zu der Fehlerdifferentialgleichung
Der Beweis dieses Hilfssatzes beruht auf der Theorie der Input-Output-Linearisierung (s. J. Slotine und
W. Li, Applied Nonlinear Control) und soll hier nicht weiter ausgeführt werden.
Der folgende Satz stellt für das Adaptionsgesetz (8)-(9) die Stabilität sicher:
Gegeben sei ein adaptives System aus einer Strecke vom Typ (14)-(15), einem Referenzmodell nach
Gl. (12), einem adaptiven Fuzzy-Regler nach Gl. (13) und dem Adaptionsgesetz (8)-(9). Dann gilt:
- 1. Wenn der inhärente Approximationsfehler d hinreichend klein ist, so sind der Parametervektor θ und der Hilfsparameter p beschränkt.
- 2. Wenn d ∼ 0 ist und ξ und uaux beschränkt sind, so ist limt→∞ e = 0.
Unter Verwendung von Hilfssatz 1 erhält man für das beschriebene System folgende Differentialgleichung
für den Fehler e:
d. h.
Für den erweiterten Fehler e* ergibt sich
hierbei ist der erweiterte Parameterfehler
und der erweiterte Aktivierungsvektor
Aus dem Adaptionsgesetz (8)-(9) ergibt sich
mit
Zum Nachweis der Beschränktheit von
wird die Ljapunow-Funktion
verwendet. Ihre Ableitung nach der Zeit ist
Ist d hinreichend klein, so ist ≦ 0; damit ist die Beschränktheit von
und somit die Beschränktheit von
θ und p nachgewiesen.
Um zu zeigen, daß limt→∞ e = 0 ist, wird zunächst bewiesen, daß limt→∞ e* = 0 ist. (Im folgenden wird
von d ∼ 0 ausgegangen.) Hierzu wird die zweite Ableitung von V berechnet:
Aus der Beschränktheit von ξ und uaux (s. Voraussetzung) und der Beschränktheit von
folgt die Be
schränktheit von
und damit die Beschränktheit von . Aus dem Lemma von Barbalat (s.
J. Slotine und W. Li, Applied Nonlinear Control) folgt nun aber, daß dann limt→∞ = limt→∞(-e*2) = 0
sein muß. Damit ist auch limt→∞ e* = 0.
Als nächster Schritt wird limt→∞ eaux = 0 bewiesen. In K. Narendra und A. Annaswamy, Siable Adaptive
Systems, wird gezeigt, daß dies der Fall ist, wenn ξ beschränkt und
quadratisch integrierbar ist. Die
quadratische Integrierbarkeit von
ergibt sich aus
Somit ist e* quadratisch integrierbar; da
und ξ f beschränkt ist, ist auch
quadratisch inte
grierbar. Damit ist nachgewiesen, daß limt→∞ eaux = 0 ist.
Schließlich kann mit derselben Argumentation gezeigt werden, daß auch
limt→∞((p uaux)f - puauxf) = 0 ist. Mit (10) folgt aus diesen Teilergebnissen limt→∞ e = 0, womit Satz 1
bewiesen ist.
Für das Regelgesetz (4) lautet das entsprechende Adaptionsgesetz
mit
Der Hilfsparameter p und das Hilfssignal uaux können hier entfallen. Die Adaption von θ 2 ist bei Unter
schreiten einer vorgegebenen unteren Schranke anzuhalten, um eine Division durch Null im Regelgesetz zu
verhindern.
Für das Regelgesetz (6) lautet das Adaptionsgesetz
mit
(Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens
verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere
mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)
Ein weiteres Problem der stabilen adaptiven Fuzzy-Regelung bestand bislang darin, daß sie auf Strecken mit
Stellgrößenbegrenzung nicht anwendbar war. Die Herleitung des Verfahrens geht davon aus, daß beliebig hohe
Stellamplituden möglich sind; Simulationen zeigen, daß das Vorhandensein einer Stellgrößenbegrenzung
zu Instabilität (d. h. unbeschränktem Anwachsen der zu adaptierenden Parameter) führt. Das resultieren
de Regelungsverhalten ist durch ständiges Hin- und Herschalten der Stellgröße zwischen positiver und
negativer Begrenzung gekennzeichnet. Auch dieses Problem konnte jedoch durch eine Weiterentwicklung
des Adaptionsgesetzes gelöst werden. Die Modifikation beruht im wesentlichen auf einer Abschaltung der
Adaption während der Begrenzungsphase sowie der Verwendung eines modifizierten Referenzsignals. Das
Adaptionsgesetz (8) wird modifiziert zu
das Adaptionsgesetz (9) wird entsprechend modifiziert. Die Bedingung (ue*ξ f < 0 ∧ |e| < εe) wird benötigt,
um ein "Hängenbleiben" in der Stellgrößenbegrenzung zu verhindern, falls alle aktiven Parameter durch
Überschwingen < umax (oder < -umax) werden sollten. In diesem Fall wird der Fehler irgendwann <
εe, und die Parameter verlassen die Begrenzung wieder. Theoretisch könnte εe, auf Null gesetzt werden;
Simulationsergebnisse haben jedoch gezeigt, daß ein Wert von εe = (0.1 . . . 1.0) . max(|ym(t)|) zu einem
besseren Verhalten der Parameter führt. Wird εe zu Null gesetzt, ist die Adaption für Parameter, die von
der Begrenzung betroffen sind, "unsymmetrisch" (Adaption zu Null hin ist möglich, während Adaption
von Null weg während der Begrenzung nicht möglich ist); dies führt in Verbindung mit dem inhärenten
Approximationsfehler zu oszillatorischem Verhalten der Parameter.
Weiterhin muß zur Erreichung stabilen Verhaltens ein modifiziertes Referenzsignal ymm eingeführt wer
den. Das modifizierte Referenzmodell hat die gleiche Dynamik wie das ursprüngliche Modell, aber seine
Zustände ymm, mm, mm, . . . y (n-1)|mm werden auf y, , , . . . y(n-1) zurückgesetzt, wenn u die Begrenzung
verläßt (In der Praxis wird das Referenzmodell zeitdiskret realisiert. Wenn u die Begrenzung verläßt, werden seine Zustände
ymm(k) . . . ymm(k - n + 1) auf y(k) . . . y(k - n + 1) zurückgesetzt. Es ist also keine Differentiation von y erforderlich).
Gleichzeitig werden die Zustände der linearen Filter für ξ f und (θ T ξ)f auf Null zurückgesetzt.
(Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens
verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere
mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)
Im folgenden soll nun die Funktionsweise des beschriebenen Verfahrens an einem Anwendungsbeispiel ver
deutlicht werden. Als unbekannte nichtlineare Strecke wurde ein Antriebssystem mit nichtlinearer Reibung
verwendet (Abb. 2). Das Antriebssystem stellt einen Zwei-Massen-Torsionsschwinger dar. Die zu regeln
de Ausgangsgröße ist die Drehzahl der Lastmasse x1; die weiteren Zustandsgrößen sind der Verdrehwinkel
der Welle x2 und die Motordrehzahl x3. Auf die Motormasse wirkt als Stellgröße das Luftspaltmoment u
(Annahme: ideale Momentenregelung); der Betrag von u ist auf den Maximalwert umax = 5,0 begrenzt.
Auf die Lastmasse wirkt ein Reibmoment ff(x1), welches nichtlinear von der Lastdrehzahl x1 abhängt. Die
Reibungskennlinie wurde durch die Arcustangens-Funktion modelliert. Die Torsionseigenfrequenz beträgt
ca. 50 Hz; die Dämpfung der Welle wurde zu Null angenommen.
Der Entwurf des Referenzmodells erfolgte nach der Methode der Doppelverhältnisse; die Ersatzzeitkon
stante des Referenzmodells wurde zu Tm = 20 ms vorgegeben.
Unter Ausnutzung des Vorwissens, daß die nichtlineare Reibung nur von x1, aber nicht von x2 und x3
abhängt, wurde ein Regelgesetz der Form
aufgestellt, bei dem alle unbekannten nichtlinearen Funktionen nur noch von x1 abhängen. Für jede der
unbekannten nichtlinearen Teilfunktionen wurde ein Funktionsapproximator mit 10 dreieckförmigen Basis
funktionen verwendet.
Simulationsergebnisse für diesen Regler sind in Abb. 3 zu sehen. Der Regler wird durch Aufschalten
eines Sollwertsignals w(t) trainiert, das alle 40 ms einen neuen Zufallswert im Bereich [-0,5, 0,5] annimmt.
Nach 300, 1800 und 7200 s wird ein dreieckförmiges Testsignal aufgeschaltet, um das erreichte Lernergebnis
zu beurteilen.
Um zu demonstrieren, daß Stabilität und Konvergenz unabhängig von den Anfangsbedingungen sind,
werden die Parametervektoren θ 2, θ 3, θ 4 und θ 5 aus (38) auf Null initialisiert; θ1 wird auf den Anfangswert
106 gesetzt. Es wird also keinerlei Vorwissen über die Parameter der Strecke zugrundegelegt. Zu Beginn der
Adaption ist das Regelgesetz also
es erfolgt somit lediglich eine Steuerung mit dem Sollwert w. Wie bereits erwähnt, geht der Adaptions
vorgang in der Anfangsphase relativ schnell vonstatten. Nach ca. 300 s folgt die Lastdrehzahl bereits grob
dem Referenzsignal ym. Danach wird die Adaption jedoch wesentlich langsamer. Auch nach 1800 s sind
- besonders im Bereich kleinerer Drehzahlen - noch deutliche Abweichungen zwischen y und ym zu erkennen.
Nach ca. 7200 s (d. h. zwei Stunden) sind Lastdrehzahl und Referenzsignal für den dreieckförmigen Sollwert
verlauf praktisch deckungsgleich. Die verbleibenden Abweichungen bei zufallsverteiltem Sollwertverlauf sind
auf die Stellgrößenbegrenzung zurückzuführen. Die Adaption wird bei Erreichen der Stellgrößenbegrenzung
angehalten (s. 2.1.5); wie man sieht, bleiben durch diese Maßnahme Stabilität und Konvergenz erhalten,
obwohl die Stellgrößenbegrenzung (aufgrund der schnellen Einstellung des Referenzmodells) bei fast jedem
Sollwertsprung erreicht wird.
Claims (5)
1. Verfahren zur stabilen direkten adaptiven Regelung nichtlinearer Strecken mit nicht exakt bekann
ter Struktur und nicht exakt bekannten Parametern, dadurch gekennzeichnet, daß das Regelgesetz
einen oder mehrere universelle nichtlineare Funktionsapproximatoren mit lokalisierten Basisfunktionen
enthält und daß die Parameter dieser Funktionsapproximatoren durch ein Adaptionsgesetz eingestellt
werden, in dem die Zeitverläufe der Basisfunktionen nach dem Prinzip des erweiterten Fehlers verarbei
tet werden, wodurch eine Differentiation der Regelgröße entfällt. Als universelle nichtlineare Funktions
approximatoren mit lokalisierten Basisfunktionen können dabei alle Verfahren zum Einsatz kommen,
bei denen der Approximationswert durch skalare Multiplikation eines Vektors von einstellbaren Para
metern mit einem Vektor von im Eingangsgrößenraum angeordneten Basisfunktionen berechnet wird,
wobei jede Basisfunktion nur in einem bestimmten Bereich des Eingangsgrößenraumes wesentlich von
Null verschieden ist. Hierzu gehören neuronale Netze mit radialen Basisfunktionen, allgemeine neuro
nale Regressionsnetzwerke sowie Fuzzy-Regler, deren Defuzzyfizierung nach dem Singleton-Verfahren
erfolgt (Verfahren nach Abschnitt 2.1.4 oder vergleichbares Verfahren).
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Regler als Eingangsgrößen den Sollwert
und alle Zustandsgrößen der Strecke, jedoch keine Ableitungen der Regelgröße erhält. Die Regler
struktur besteht entweder aus einem universellen nichtlinearen Funktionsapproximator, dem die Reg
lereingangsgrößen zugeführt werden und der direkt die Stellgröße berechnet, oder aus zwei universellen
nichtlinearen Funktionsapproximatoren, denen die Reglereingangsgrößen zugeführt werden und deren
Ausgangsgrößen zur Ermittlung der Stellgröße dividiert werden (Verfahren nach Abschnitt 2.1.1 oder
vergleichbares Verfahren).
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß aufgrund von Vorwissen eine Aufteilung
des Regelgesetzes in mehrere Teilfunktionen erfolgt, von denen einige im voraus bekannt sind und bei
den übrigen im voraus bekannt ist, von welchen Reglereingangsgrößen sie abhängen. Das Regelgesetz
besteht aus den bekannten Teilfunktionen sowie universellen nichtlinearen Funktionsapproximatoren,
welche die unbekannten Teilfunktionen erlernen. Dabei werden diesen Funktionsapproximatoren nicht
alle Reglereingangsgrößen zugeführt, sondern nur diejenigen, von denen die entsprechenden unbekann
ten Teilfunktionen wirklich abhängen (Verfahren nach Abschnitt 2.1.2 oder vergleichbares Verfahren).
4. Verfahren nach Anspruch 1-3, dadurch gekennzeichnet, daß durch Ausnutzung von Symmetrie
eigenschaften die Anzahl der adaptierten Parameter und damit auch die benötigte Lernzeit sowie
der Rechenzeit- und Speicherplatzbedarf verringert wird. Dies erfolgt durch eine geeignete Zusam
menfassung von je zwei Parametern bzw. den zwei zugehörigen Basisfunktionen, so daß jeweils zwei
Parameter zusammengefaßt werden, die aufgrund der Symmetrieeigenschaften gegen denselben Wert
bzw. denselben Wert mit umgekehrtem Vorzeichen konvergieren (Verfahren nach Abschnitt 2.1.3 oder
vergleichbares Verfahren).
5. Verfahren nach Anspruch 1-4, dadurch gekennzeichnet, daß keine Adaption der Parameter statt
findet, solange sich die Stellgröße an der Begrenzung befindet, und daß bei Verlassen der Stellgrößen
begrenzung der Zustand des Referenzmodells auf den Streckenzustand zurückgesetzt wird (Verfahren
nach Abschnitt 2.1.5 oder vergleichbares Verfahren).
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE1996141066 DE19641066A1 (de) | 1996-10-04 | 1996-10-04 | Verfahren zur direkten adaptiven Regelung nichtlinearer Strecken |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE1996141066 DE19641066A1 (de) | 1996-10-04 | 1996-10-04 | Verfahren zur direkten adaptiven Regelung nichtlinearer Strecken |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE19641066A1 true DE19641066A1 (de) | 1998-04-23 |
Family
ID=7807931
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE1996141066 Withdrawn DE19641066A1 (de) | 1996-10-04 | 1996-10-04 | Verfahren zur direkten adaptiven Regelung nichtlinearer Strecken |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE19641066A1 (de) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19942144A1 (de) * | 1999-09-03 | 2001-06-07 | Schroeder Dierk | Verfahren zur adaptiven Schwingungsdämpfung mittels neuronaler Netze |
-
1996
- 1996-10-04 DE DE1996141066 patent/DE19641066A1/de not_active Withdrawn
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19942144A1 (de) * | 1999-09-03 | 2001-06-07 | Schroeder Dierk | Verfahren zur adaptiven Schwingungsdämpfung mittels neuronaler Netze |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69315423T2 (de) | Neuro-Pid Regler | |
| DE69803606T2 (de) | Verfahren zum vorhersagen der ueberschwingung in einem steuerungssystem | |
| EP2106576B1 (de) | Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems | |
| DE69413812T2 (de) | Auf Fuzzylogik beruhendes Steuerungs-Verfahren für Stromversorgungen und Gerät zur dessen Durchführung | |
| DE19531692C2 (de) | Verfahren zur Beobachtung nicht meßbarer Größen nichtlinearer dynamischer Systeme | |
| DE19606480C2 (de) | Verfahren und Anordnung zur Adaption eines Fuzzy-Reglers | |
| DE69400710T2 (de) | Fuzzy Logik Steuerungsverfahren bzw. -vorrichtung für einen Induktionsmotor | |
| DE10261727A1 (de) | Steuersystem in Fuzzy-Logik für ein Rad eines Kraftfahrzeugs und Verfahren zum Implementieren einer Fuzzy-Logikeinheit für derartiges Rad eines Kraftfahrzeuges | |
| DE2347741A1 (de) | Prozessregelorgan mit selbsttaetiger anpassung an unbekannte oder veraenderliche parameter | |
| EP0998700B1 (de) | Verfahren zur generierung von ankopplungsbahnen, verwendbar zur führung eines fahrzeugs zu einer vorgegebenen zielbahn | |
| EP0520233B1 (de) | Einrichtung zur Identifikation einer Übertragungsstrecke | |
| DE2510837C3 (de) | Einrichtung zur Regelung von totzeitbehafteten Regelstrecken | |
| EP0708936B1 (de) | Anordnung zur modellierung eines nichtlinearen prozesses | |
| EP1119799A1 (de) | Regeleinrichtung zur regelung einer strecke mit mehreren verkoppelten regelgrössen | |
| EP2933502B1 (de) | Digitalhydraulisches Antriebssystem | |
| DE3742686A1 (de) | Vorrichtung zur modellgefuehrten steuerung eines roboters | |
| DE1523535C3 (de) | Selbstanpassender Regelkreis | |
| EP0752630A1 (de) | Selbsteinstellbare Regeleinrichtung und Verfahren zur Selbsteinstellung dieses Reglers | |
| DE112021004158T5 (de) | Steuerungsunterstützungsvorrichtung, Steuerungssystem und Steuerungsunterstützungsverfahren | |
| DE19641066A1 (de) | Verfahren zur direkten adaptiven Regelung nichtlinearer Strecken | |
| DE3721504A1 (de) | Regelsystem | |
| DE4229280A1 (de) | Fuzzy-rueckkopplungs-regeleinrichtung | |
| DE102016111065A1 (de) | Regelverfahren mit modellbasiertem Anti-Windup | |
| EP0614547B1 (de) | Verfahren zur regelung für dynamische systeme n-ter ordnung | |
| EP0786709A1 (de) | Schaltungsanordnung eines Reglers mit nachgiebiger Rückführung |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| 8122 | Nonbinding interest in granting licenses declared | ||
| 8139 | Disposal/non-payment of the annual fee |