DE19641066A1 - Direct adaptive control of non linear system - Google Patents
Direct adaptive control of non linear systemInfo
- Publication number
- DE19641066A1 DE19641066A1 DE1996141066 DE19641066A DE19641066A1 DE 19641066 A1 DE19641066 A1 DE 19641066A1 DE 1996141066 DE1996141066 DE 1996141066 DE 19641066 A DE19641066 A DE 19641066A DE 19641066 A1 DE19641066 A1 DE 19641066A1
- Authority
- DE
- Germany
- Prior art keywords
- parameters
- law
- functions
- basic functions
- adaptation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 57
- 230000006870 function Effects 0.000 claims description 46
- 230000006978 adaptation Effects 0.000 claims description 31
- 239000013598 vector Substances 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 230000008901 benefit Effects 0.000 claims description 6
- 230000004069 differentiation Effects 0.000 claims description 5
- 238000012886 linear function Methods 0.000 claims description 4
- 230000001537 neural effect Effects 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 9
- 230000006399 behavior Effects 0.000 description 6
- 238000000926 separation method Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003534 oscillatory effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- URWAJWIAIPFPJE-YFMIWBNJSA-N sisomycin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H](CC=C(CN)O2)N)[C@@H](N)C[C@H]1N URWAJWIAIPFPJE-YFMIWBNJSA-N 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/0275—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using fuzzy logic only
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
Description
Bei industriellen Anwendungen der Regelungstechnik sind häufig Strecken zu regeln, welche durch ausge prägte Nichtlinearitäten gekennzeichnet sind und bei denen weiterhin Parameter und Struktur nicht exakt bekannt sind. Zur Regelung solcher Strecken dienen adaptive nichtlineare Regelungsverfahren. Diese lassen sich zunächst einteilen in Verfahren, die auf eine bestimmte Streckenstruktur zugeschnitten sind, und weit gehend universell einsetzbare Verfahren. Zur zweiten Klasse gehören Regelungsverfahren mit neuronalen Netzen sowie adaptive Fuzzy-Regler. Bei den meisten dieser Verfahren ist über die Stabilität und Konver genz des Gesamtsystems aus Strecke, Regler und Adaptionsgesetz keine Aussage möglich; daher können diese Verfahren nur zur Regelung von Strecken eingesetzt werden, die nicht stabilitätskritisch sind, und es sind zusätzliche Überwachungsmaßnahmen erforderlich. Bei einer Reihe von Verfahren ist dagegen ein Sta bilitätsbeweis möglich. Hierbei ist zu unterscheiden zwischen indirekten Verfahren, bei denen zunächst eine Identifikation der Strecke und darauf abgestimmt die Regelung aufgrund des identifizierten Streckenmodells erfolgt; bei direkten Verfahren, wird dagegen der Regler direkt adaptiert, um ein vorgegebenes Verhalten des Regelkreises zu erreichen. Während bei indirekten Verfahren ein Stabilitätsbeweis i.a. nur für das Teil system Strecke - Identifikationsmodell - Adaptionsgesetz möglich ist, kann bei direkten Verfahren Stabilität für das Gesamtsystem aus Strecke, Regler und Adaptionsgesetz bewiesen werden. Es wurde bislang bereits eine Reihe solcher Verfahren veröffentlicht: Tzirkel, E., and Fallside, F., A Direct Control Method for a Class of Nonlinear Systems Using Neutral Networks, Technical Report, Cambridge University Engineering Department, Cambridge, 1993; E. Tzirkel-Hancock and F. Fallside, Stable Control of Nonlinear Systems Using Neural Networks, Int. J. Robust and Nonlinear Control, Vol. 2, no. 1, 1992; Robert M. Sanner and Jean-Jacques E. Slotine, Gaussian Networks for Direct Adaptive Control, IEEE Transactions on Neural Networks, Vol. 3, no. 6, 1992; Clemens Schäffner and Dierk Schröder, An Application of General Regres sion Neural Network to Nonlinear Adaptive Control, 5th European Conference on Power Electronics and Applications (EPE), Vol. 4, Brighton, 1993; Clemens Schäffner, Analyse und Synthese neuronaler Regelungs verfahren, Dissertation, Technische Universität München, Lehrstuhl für elektrische Antriebstechnik, 1996; Li-Xin Wang, Slable Adaptive Fuzzy Control of Nonlinear Systems, IEEE Transactions on Fuzzy Systems, Vol. 1, 1993.In industrial applications of control technology, routes are often to be controlled, which are characterized by Embossed nonlinearities are marked and where parameters and structure continue to be not exact are known. Adaptive non-linear control methods are used to control such lines. Leave this first of all divide into procedures that are tailored to a specific route structure, and widely all-round processes. The second class includes control procedures with neuronal Networks as well as adaptive fuzzy controllers. Most of these methods are about stability and convergence Given the overall system consisting of the system, controller and adaptation law, no statement is possible; therefore can these methods are only used to control lines that are not critical to stability, and it additional monitoring measures are required. In contrast, in a number of procedures a sta proof of balance possible. A distinction must be made between indirect methods, in which one is used first Identification of the route and the regulation based on the identified route model he follows; with direct methods, on the other hand, the controller is directly adapted to a given behavior of the control loop. While indirect methods generally prove stability. only for the part system route - identification model - adaptation law is possible, with direct procedures stability for the entire system consisting of the system, controller and adaptation law. It has been done so far published a number of such procedures: Tzirkel, E., and Fallside, F., A Direct Control Method for a Class of Nonlinear Systems Using Neutral Networks, Technical Report, Cambridge University Engineering Department, Cambridge, 1993; E. Tzirkel-Hancock and F. Fallside, Stable Control of Nonlinear Systems Using Neural Networks, Int. J. Robust and Nonlinear Control, Vol. 2, no. 1, 1992; Robert M. Sanner and Jean-Jacques E. Slotine, Gaussian Networks for Direct Adaptive Control, IEEE Transactions on Neural Networks, Vol. 3, no. 6, 1992; Clemens Schäffner and Dierk Schröder, An Application of General Regres sion Neural Network to Nonlinear Adaptive Control, 5th European Conference on Power Electronics and Applications (EPE), Vol. 4, Brighton, 1993; Clemens Schäffner, analysis and synthesis of neuronal regulation proceedings, dissertation, Technical University of Munich, Chair of Electrical Drive Technology, 1996; Li-Xin Wang, Slable Adaptive Fuzzy Control of Nonlinear Systems, IEEE Transactions on Fuzzy Systems, Vol. 1, 1993.
Diese Regelungsverfahren basieren auf der Grundstruktur nach Abb. 1, wobei statt des Fuzzy-Reglers
auch genausogut ein neuronales Netz als nichtlinearer Funktionsapproximator eingesetzt werden kann. Gege
ben ist eine nichtlineare Strecke bekannter Ordnung, deren Struktur und Parameter jedoch völlig unbekannt
oder nur zum Teil bekannt sind, sowie ein Referenzmodell, welches das gewünschte Führungsverhalten des
geschlossenen Regelkreises vorgibt. Das Referenzmodell ist so zu gestalten, daß die physikalischen Gege
benheiten der realen nichtlinearen Strecke und des Stellgliedes berücksichtigt werden. Die Strecke ist so zu
regeln, daß ihre Ausgangsgröße y dem Referenzsignal ym folgt. u ist die Stellgröße, x der Zustandsvektor
der Strecke, n die Ordnung der Strecke und e = y-ym der Ausgangsfehler. Das Regelgesetz ist von der
Form
These control methods are based on the basic structure according to Fig. 1, whereby instead of the fuzzy controller, a neural network can be used as well as a non-linear function approximator. Given is a non-linear system of known order, the structure and parameters of which are completely unknown or only partially known, and a reference model that specifies the desired control behavior of the closed control loop. The reference model must be designed so that the physical conditions of the real non-linear path and the actuator are taken into account. The distance must be controlled so that its output variable y follows the reference signal y m . u is the manipulated variable, x the state vector of the system, n the order of the system and e = yy m the output error. The rule law is of the form
hierbei stellen die Ausdrücke θ T|1ξ(x) und θ T|2ξ(x) universelle nichtlineare Funktionsapproximatoren dar, also
z. B. neuronale Netze mit radialen Basisfunktionen oder adaptive Fuzzy-Regler (s. u.). Die Parametervektoren
dieser Funktionsapproximatoren werden durch ein Adaptionsgesetz der Form
the expressions θ T | 1 ξ ( x ) and θ T | 2 ξ ( x ) represent universal nonlinear function approximators, e.g. B. neural networks with radial basic functions or adaptive fuzzy controllers (see below). The parameter vectors of these function approximators are given the form by an adaptation law
eingestellt. Dabei ist γ die Adaptionsverstärkung. Mit Hilfe der Stabilitätstheorie von Ljapunow kann nun gezeigt werden, daß das Gesamtsystem stabil ist und der Fehler e gegen Null konvergiert, wenn die Strecke und die Eingangssignale gewissen Bedingungen genügen und die Koeffizienten p1 . . . pn die sog. Ljapunow- Gleichung erfüllen.set. Here γ is the adaptation gain. With the help of the stability theory of Ljapunow it can now be shown that the overall system is stable and the error e converges to zero if the path and the input signals meet certain conditions and the coefficients p 1 . . . p n satisfy the so-called Lyapunov equation.
Die bislang veröffentlichten Verfahren weisen jedoch eine Reihe von Nachteilen auf, die einer breiten
praktischen Anwendung entgegenstehen bzw. diese praktisch verhindern:
However, the processes published to date have a number of disadvantages which prevent or practically prevent their widespread practical use:
- - Sowohl für das Regelgesetz als auch für das Adaptionsgesetz werden n-1 Ableitungen der Regelgröße benötigt (n = Ordnung der Strecke); in der Praxis ist dies jedoch aufgrund der immer vorhandenen Meßstörungen im allgemeinen nicht realisierbar.- For both the control law and the adaptation law, n-1 derivatives of the control variable required (n = order of the route); in practice, however, this is due to the always existing Measurement disturbances in general cannot be realized.
- - Die Verfahren funktionieren nicht bei Vorhandensein einer Stellgrößenbegrenzung; das Vorhandensein einer solchen Begrenzung bewirkt i.a. eine Divergenz der adaptierten Parameter, d. h. Instabilität. In der Praxis sind jedoch bei keiner Strecke unbegrenzte Stellgrößen möglich; in den meisten Fällen ist die Stellgröße soweit begrenzt, daß die Begrenzung auch in real vorkommenden Betriebszuständen erreicht wird.- The procedures do not work if there is a manipulated variable limit; the presence Such a limitation generally causes a divergence of the adapted parameters, i.e. H. Instability. In in practice, however, unlimited manipulated variables are not possible on any route; in most cases the manipulated variable is limited so far that the limitation also occurs in real operating conditions is achieved.
- - Rechenzeit- und Speicherplatzbedarf wachsen exponentiell mit der Ordnung der Strecke an. Auch die Zeit bis zum Erlernen des gewünschten Regelgesetzes wächst stark mit der Ordnung der Strecke an und ist generell relativ groß. Diese Zeit ergibt sich aus der Dynamik des Gesamtsystems aus Strecke, Regler und Adaptionsgesetz und hängt von zahlreichen Einflußfaktoren ab; bereits für relativ einfache Strecken dritter Ordnung kann sie bei mehreren Tagen liegen, was in der Praxis nicht tolerierbar ist.- Computing time and storage space requirements grow exponentially with the order of the route. Also the Time to learn the desired control law increases strongly with the order of the route and is generally relatively large. This time results from the dynamics of the overall system from the route, Regulator and adaptation law and depends on numerous influencing factors; already for relatively simple ones Third order routes can be several days, which is not tolerable in practice.
Im folgenden Abschnitt wird ein verbessertes adaptives nichtlineares direktes Regelungsverfahren be schrieben, welches diese Nachteile behebt.The following section describes an improved adaptive nonlinear direct control method wrote, which overcomes these disadvantages.
Dem Verfahren liegt wieder die Systemstruktur nach Abb. 1 zugrunde. Die Strecke ist so zu regeln, daß ihre Ausgangsgröße y dem Referenzsignal ym folgt. Für eine bestimmte Klasse von Strecken und Refe renzmodellen kann mittels des Ansatzes der Input-Output-Linearisierung (s. J. Slotine und W. Li, Applied Nonlinear Control) gezeigt werden, daß ein Regelgesetz existiert, welches diese Aufgabe erfüllt. Dieses "idea le" Regelgesetz kann aber nicht explizit berechnet werden, da die Strecke unbekannt ist; daher werden zu seiner Ermittlung Methoden der künstlichen Intelligenz eingesetzt. Hierfür kommen alle Verfahren in Frage, die zum Erlernen statischer nichtlinearer Funktionen geeignet sind, also Radial-Basis-Function-Netzwerke (s. Tzirkel, E., and Fallside, F., A Direct Control Method for a Class of Nonlinear Systems Using Neural Networks, und Robert M. Sanner and Jean-Jacques E. Slotine, Gaussian Networks for Dired Adaptive Con trol), General-Regression-Netzwerke (s. Clemens Schäffner and Dierk Schröder, An Application of General Regression Neural Network to Nonlinear Adaptive Control) oder adaptive Fuzzy-Regler (s. Li-Xin Wang, Stable Adaptive Fuzzy Control of Nonlinear Systems). Das Grundprinzip bleibt bei allen genannten Verfah ren gleich; der Einsatz eines Fuzzy-Reglers hat dabei den Vorteil, daß das Regelgesetz nicht als "black box", sondern in Form anschaulicher WENN-DANN-Regeln vorliegt. Dies ist besonders nützlich, wenn verbal formuliertes Vorwissen zur Initialisierung des Reglers genutzt werden soll. In den folgenden Ausführungen soll deshalb der Ansatz unter Verwendung von Fuzzy-Reglern dargestellt werden; dies soll aber nur als Beispiel dienen und bedeutet keine Beschränkung der vorgestellten Verfahren auf die Fuzzy-Regelung, d. h. es können auch die anderen Methoden verwendet werden.The process is again based on the system structure according to Fig. 1. The distance must be controlled so that its output variable y follows the reference signal y m . For a certain class of lines and reference models, the approach of input-output linearization (see J. Slotine and W. Li, Applied Nonlinear Control) can be used to show that a rule exists that fulfills this task. However, this "ideal le" rule law cannot be calculated explicitly because the route is unknown; therefore, artificial intelligence methods are used to determine it. All methods that are suitable for learning static nonlinear functions, i.e. radial basis function networks (see Tzirkel, E., and Fallside, F., A Direct Control Method for a Class of Nonlinear Systems Using Neural Networks, and Robert M. Sanner and Jean-Jacques E. Slotine, Gaussian Networks for Dired Adaptive Control, General Regression Networks (see Clemens Schäffner and Dierk Schröder, An Application of General Regression Neural Network to Nonlinear Adaptive Control) or adaptive fuzzy controllers (see Li-Xin Wang, Stable Adaptive Fuzzy Control of Nonlinear Systems). The basic principle remains the same in all of the methods mentioned; The use of a fuzzy controller has the advantage that the control law is not available as a "black box", but in the form of clear IF-THEN rules. This is particularly useful when verbally formulated prior knowledge is to be used to initialize the controller. The approach using fuzzy controllers will therefore be presented in the following explanations; however, this is only intended to serve as an example and does not limit the methods presented to fuzzy control, ie the other methods can also be used.
Das Regelgesetz zur Berechnung der Stellgröße u aus dem Sollwert w und dem Zustandsvektor x kann
unterschiedliche Formen besitzen. Die einfachste Form ist
The control law for calculating the manipulated variable u from the setpoint w and the state vector x can have different forms. The simplest form is
hierbei ist θ T ξ(w, x) ein universeller nichtlinearer Funktionsapproximator, z. B. ein neuronales Netzwerk mit radialen Basisfunktionen, ein allgemeines neuronales Regressionsnetzwerk oder ein bestimmter Typ von Fuzzy-Regler (s. Li-Xin Wang, Stable Adaptive Fuzzy Control of Nonlinear Systems). Der Vektor θ enthält die einstellbaren Parameter des Funktionsapproximators, der Vektor ξ enthält lokalisierte Basisfunktionen, von denen jede in einem begrenzten Bereich des Eingangsgrößenraumes zur Approximation beiträgt, im übrigen Eingangsgrößenraum dagegen Null oder näherungsweise Null ist.here θ T ξ (w, x ) is a universal nonlinear function approximator, e.g. B. a neural network with radial basic functions, a general neural regression network or a certain type of fuzzy controller (see Li-Xin Wang, Stable Adaptive Fuzzy Control of Nonlinear Systems). The vector θ contains the adjustable parameters of the function approximator, the vector ξ contains localized basic functions, each of which contributes to the approximation in a limited range of the input size space, whereas in the remaining input size space it is zero or approximately zero.
Dieses Regelgesetz ist nur für Strecken einsetzbar, bei denen die Lie-Ableitung LgL n-1|fh(x) (s. u.) kon
stant ist. Ist LgL n-1|fh(x) nicht konstant, findet das Regelgesetz
This rule of law can only be used for lines where the Lie derivative L g L n-1 | fh ( x ) (see below) is constant. If L g L n-1 | fh ( x ) is not constant, the control law finds
Anwendung. Im Gegensatz zu Regelgesetzen der Form (1) benötigen diese Regelgesetze keine Differentiation des Fehlers e und damit der Regelgröße y. Ihre Einsetzbarkeit beruht auf dem Hilfssatz 1. (Die hier ange gebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.) Application. In contrast to rule laws of the form (1), these rule laws do not require differentiation the error e and thus the controlled variable y. Their applicability is based on auxiliary sentence 1. (The here The given mathematical equations are only intended to clarify the basic principle of the method. The practical implementation can be done according to these equations or by other mathematical Representations that implement the same basic principle.)
Bei den beiden soeben genannten Regelgesetzen ist die Stellgröße eine allgemeine nichtlineare Funktion aller
Reglereingangsgrößen. Daher werden universelle Funktionsapproximatoren benötigt, welche alle Reglerein
gangsgrößen als Eingangsgrößen besitzen. Dies führt bei Strecken höherer Ordnung zu Problemen mit dem
Rechenzeit- und Speicherplatzbedarf sowie der Lernzeit. Eine mögliche Lösung besteht darin, das Regelge
setz in lineare und nichtlineare Teilfunktionen aufzuteilen, die dann getrennt erlernt werden können. Eine
solche Aufteilung kann aufgrund von Vorwissen über die Streckenstruktur vorgenommen werden. In vielen
Fällen ist es möglich, die Differentialgleichungen der Strecke in bekannte und unbekannte Teilfunktionen
aufzuteilen. Für dieses teilweise bekannte Streckenmodell kann dann über die Lie-Ableitungen das ideale
Regelgesetz berechnet werden. Es hat die allgemeine Form (vgl. Hilfssatz 1)
With the two control laws just mentioned, the manipulated variable is a general non-linear function of all controller input variables. Therefore, universal function approximators are required, which have all controller input variables as input variables. For higher-order routes, this leads to problems with the computing time and storage space requirements and the learning time. One possible solution is to divide the rule into linear and non-linear sub-functions, which can then be learned separately. Such a division can be made based on previous knowledge of the route structure. In many cases it is possible to divide the differential equations of the system into known and unknown sub-functions. The ideal rule law can then be calculated for this partially known route model using the Lie derivatives. It has the general form (see auxiliary sentence 1)
wobei die Teilfunktionen f*ki,j(x) bekannt und die Teilfunktionen f*ui,j(x) unbekannt sind. b1m ist der erste
Zählerkoeffizient des Referenzmodells. Der wesentliche Vorteil besteht nun darin, daß i.a. die unbekannten
Teilfunktionen f*ui,j(x) nicht von allen Reglereingangsgrößen abhängen, sondern nur von einigen bestimm
ten Eingangsgrößen. Welche Teilfunktionen von welchen Eingangsgrößen abhängen, ist im voraus bekannt.
Dieses Vorwissen wird zur Aufstellung des Regelgesetzes
where the subfunctions f * ki, j ( x ) are known and the subfunctions f * ui, j ( x ) are unknown. b 1m is the first counter coefficient of the reference model. The main advantage is that the unknown partial functions f * ui, j ( x ) do not depend on all controller input variables, but only on some specific input variables. Which subfunctions depend on which input variables is known in advance. This prior knowledge becomes the establishment of the regular law
verwendet. Der Vorteil besteht nun darin, daß auch hier die unbekannten nichtlinearen Teilfunktionen θ T|i,jξ i,j(x) nicht von allen Reglereingangsgrößen abhängen. Dadurch haben die Basisfunktionen eine niedri gere Dimension, und es werden insgesamt weniger Parameter benötigt (s. Beispiel in Abschnitt 2.2). (Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens ver deutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)used. The advantage is that the unknown non-linear subfunctions θ T | i, j ξ i, j ( x ) do not depend on all controller input variables. As a result, the basic functions have a lower dimension and fewer parameters are required overall (see example in section 2.2). (The mathematical equations given here are only intended to clarify the basic principle of the method. The practical implementation can be carried out according to these equations or also by other mathematical representations that implement the same basic principle.)
Eine Reduktion der Parameteranzahl - und damit von Rechenzeit- und Speicherplatzbedarf sowie Lernzeit-
kann durch Ausnutzung von Symmetrieeigenschaften erreicht werden. Die Dynamik vieler Strecken weist
(näherungsweise) Symmetrieeigenschaften zum Punkt
A reduction of the number of parameters - and thus of computing time and storage space requirements as well as learning time - can be achieved by using symmetry properties. The dynamics of many lines show (approximately) symmetry properties to the point
aus denen folgt, daß
from which it follows that
ist. Folglich ist alle Information, die zur
Beschreibung des Regelgesetzes erforderlich ist, in der Hälfte des Parametervektors enthalten. Um dies
auszunutzen, werden auch die Basisfunktionen
is. Consequently, all of the information required to describe the control law is contained in half of the parameter vector. To take advantage of this, the basic functions are also
des nichtlinearen Funktionsapproximators symmetrisch
zum Punkt
of the nonlinear function approximator symmetrical to the point
angeordnet. Der Basisfunktionsvektor ξ wird in zwei gleich große Untervektoren ξ ⁺ und
ξ ⁻ unterteilt, so daß gilt:
arranged. The basic function vector ξ is divided into two subvectors ξ ⁺ and ξ ⁻ of the same size, so that:
(Liegt eine Basisfunktion genau symmetrisch zum Punkt
(If a basic function is exactly symmetrical to the point
so muß der zugehörige Parameter Null sein; daher kann diese Basisfunktion weggelassen werden.) Wird nun der Parametervektor θ ebenfalls in zwei entsprechende Untervektoren θ⁺ und θ⁻ aufgeteilt, kann ein neues Regelgesetz als u' = θ' T ξ' mit θ' = θ⁺ und ξ' = ξ⁺ - ξ⁻ geschrieben werden. Da θ⁺ = -θ⁻ ist (aufgrund der Symmetrie von fc), ergibt sich u' = u. Das neue Regelgesetz liefert also die gleiche Stellgröße wie (3), kommt aber mit der Hälfte der Parameter aus. Die Adaption erfolgt genau wie für das ursprüngliche Regelgesetz, wobei ξ durch ξ' zu ersetzen ist.the associated parameter must be zero; Therefore, this basic function can be omitted.) Now, if the parameter vector also θ into two corresponding sub-vectors θ ⁺ and divided θ ⁻, a new control law as u '= θ' T ξ 'with θ' = θ ⁺ and ξ '= ξ ⁺ - ξ ⁻ can be written. Since θ ⁺ = - θ ⁻ (due to the symmetry of f c ), u '= u. The new control law thus provides the same manipulated variable as (3), but manages with half the parameters. The adaptation is carried out exactly as for the original control law, whereby wobei is to be replaced by ξ ' .
Die Rechenzeiteffizienz kann erhöht werden, indem nicht alle Basisfunktionen ξ⁺ und ξ⁻ berechnet werden. Dies ist möglich, wenn die Aufteilung der Basisfunktionen entlang einer (Hyper-)ebene orthogonal zu einer Achse des Eingangsgrößenraumes erfolgt (d. h. beispielsweise x1 = 0 als Trennungsebene). Dann sind nämlich die meisten Basisfunktionen auf einer Seite der Trennungsebene gleich Null (oder bei Funktionen, die nicht den Wert Null annehmen - wie z. B. radiale Gaußsche Basisfunktionen - vernachlässigbar klein). Lediglich Basisfunktionen, deren Zentren in der Nähe oder auf der Trennungsebene liegen, sind auf beiden Seiten der Trennungsebene von Null verschieden. Ersetzt man nun vor Berechnung der Basisfunktionen x1 durch |x1| (es wird davon ausgegangen, daß x1 = 0 die Trennungsebene ist und die Basisfunktionen ξ +|k auf der Seite x1 < 0 liegen), so sind die meisten Basisfunktionen ξ -|k konstant Null oder sehr klein und können bei der Berechnung weggelassen werden; d. h. die Berechnung von ξ' vereinfacht sich erheblich. Um die Betragsbildung von x1 wieder auszugleichen, muß die berechnete Stellgröße mit dem Vorzeichen von x1 multipliziert werden. The computing time efficiency can be increased by not calculating all basic functions ξ ⁺ and ξ ⁻. This is possible if the division of the basic functions takes place along a (hyper) plane orthogonal to an axis of the input quantity space (ie for example x 1 = 0 as the separation plane). Then most of the basic functions on one side of the separation level are zero (or for functions that do not take the value zero - such as radial Gaussian basic functions - negligibly small). Only basic functions whose centers are close to or on the separation level are different from zero on both sides of the separation level. Now replace x 1 with | x 1 | before calculating the basic functions (it is assumed that x 1 = 0 is the separation plane and the basic functions ξ + | k are on the side x 1 <0), so most basic functions ξ - | k are constantly zero or very small and can be used in the calculation be omitted; ie the calculation of ξ ' is considerably simplified. To compensate for the amount of x 1 again, the calculated manipulated variable must be multiplied by the sign of x 1 .
Für die Regelgesetze (4) und (6) ist die Ausnutzung der Symmetrie nach demselben Prinzip möglich.For rule laws (4) and (6), symmetry can be used according to the same principle.
Bei Regelgesetz (4) erfolgt die Aufteilung getrennt für die Basisfunktionsvektoren ξ 1(w, x) und ξ 2(x). Bei
Regelgesetz (6) erfolgt die Aufteilung getrennt für die Basisfunktionsvektoren ξ 1 = [ξ T|1,1(x) . f*k1,1(x), ξ T|1,2(x) .
f*k1,2(x), . . .]T und ξ 2 = [ξ T|2,1(x) . f*k2,1(x), ξ T|2,2(x) . f*k2,2(x), . . .]T. Dabei sind die unterschiedlichen Symmetrieeigenschaften
der bekannten Teilfunktionen f*ki,j(x) zu beachten: es kann entweder gelten f*ki,j(x) =
f*ki,j(-x) oder f*ki,j(x) = -f*ki,j(-x). Für die kombinierten Basisfunktionsvektoren ξ 1 und ξ 2 gilt also:
With control law (4), the division is made separately for the basic function vectors ξ 1 (w, x ) and ξ 2 ( x ). In the control law (6), the division takes place separately for the basic function vectors ξ 1 = [ ξ T | 1,1 ( x ). f * k1.1 ( x ), ξ T | 1.2 ( x ). f * k1.2 ( x ) ,. . .] T and ξ 2 = [ ξ T | 2.1 ( x ). f * k2.1 ( x ), ξ T | 2.2 ( x ). f * k2.2 ( x ) ,. . .] T. The different symmetry properties of the known subfunctions f * ki, j ( x ) must be noted: either f * ki, j ( x ) = f * ki, j (- x ) or f * ki, j ( x ) = -f * ki, j (- x ). The following therefore applies to the combined basic function vectors ξ 1 and gilt 2 :
Für die Parameter gilt entsprechend θ +|k = -vkθ -|k; das modifizierte Regelgesetz wird folglich mit θ' = θ⁺ und ξ' = ξ⁺ - Vξ⁻, V = diag(vk) gebildet. (Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Dar stellungsweisen, die dasselbe Grundprinzip realisieren.)The following applies correspondingly to the parameters θ + | k = -v k θ - | k; the modified rule law is consequently formed with θ ' = θ ⁺ and ξ' = ξ ⁺ - V ξ ⁻, V = diag (v k ). (The mathematical equations given here are only intended to clarify the basic principle of the method. The practical implementation can be carried out according to these equations or by other mathematical representations which implement the same basic principle.)
Um im weiteren die Formeln zu vereinfachen, soll folgende Schreibweise vereinbart werden: Ist z(t) ein
zeitabhängiges Signal, so wird mit zf(t) dasjenige Signal bezeichnet, welches aus z(t) durch die lineare
Filterung
In order to simplify the formulas below, the following notation should be agreed: If z (t) is a time-dependent signal, then z f (t) denotes the signal that consists of z (t) through linear filtering
entsteht. arises.
Unter Verwendung dieser Schreibweise lautet das Adaptionsgesetz mit erweitertem Fehler für das Re
gelgesetz (3)
Using this notation, the adaptation law with extended error for the control law is (3)
Dabei sind γ < 0 und
Here are γ <0 and
die Adaptionsverstärkungen und e* der erweiterte Fehler (s. J. Slotine und
W. Li, Applied Nonlinear Control); der erweiterte Fehler ist definiert als
the adaptation gains and e * the extended error (see J. Slotine and W. Li, Applied Nonlinear Control); the extended error is defined as
mit dem Hilfsfehler
with the auxiliary error
p und uaux sind Hilfssignale, die aus folgendem Grund benötigt werden: Zur Berechnung des erweiterten
Fehlers (10) ist ein Schätzwert für die Streckenverstärkung LgL n-1|fh(x) (im weiteren kurz als kp bezeichnet)
erforderlich. Dieser Wert ist jedoch bei dem verwendeten Regelgesetz nicht explizit verfügbar, sondern impli
zit in fc(w, x, θ) enthalten; daher muß kp durch einen internen Hilfsparameter p geschätzt werden. Für die
Adaption von p wird das Hilfssignal uaux benötigt, welches gemäß folgenden Gleichungen in Referenzmodell
und Regelgesetz eingespeist wird:
p and u aux are auxiliary signals that are required for the following reason: To calculate the extended error (10), an estimate for the path gain L g L n-1 | fh ( x ) (hereinafter referred to as k p for short) is required. However, this value is not explicitly available with the rule of law used, but is implicitly contained in f c (w, x , θ ); therefore k p must be estimated by an internal auxiliary parameter p . The auxiliary signal u aux is required for the adaptation of p , which is fed into the reference model and control law according to the following equations:
Für den Stabilitätsbeweis wird zunächst folgender Hilfssatz benötigt:The following auxiliary set is required to prove stability:
Gegeben sei eine SISO-Strecke der Form
Given a SISO range of the form
deren relativer Grad r gleich ihrer Ordnung n ist (Der relative Grad ist definiert als die Ordnung der niedrigsten Ableitung von y, die direkt von der Eingangsgröße u abhängt
(s. J. Slotine und W. Li, Applied Nonlinear Control). Für lineare Systeme ist dies gleichbedeutend mit der bekannten Definition
"Anzahl der Pole minus Anzahl der Nullstellen"), sowie ein lineares Referenzmodell
whose relative degree r is equal to their order n (the relative degree is defined as the order of the lowest derivative of y, which depends directly on the input variable u (see J. Slotine and W. Li, Applied Nonlinear Control). For linear systems this is synonymous with the well-known definition "number of poles minus number of zeros"), as well as a linear reference model
der Ordnung n mit dem Zählergrad Null. Existieren in einem bestimmten Bereich des Zustandsraumes die
Lie-Ableitungen L n|fh(x) und LgL n-1|fh(x) und ist in dem betreffenden Bereich LgL n-1|fh(x) = const. ≠ 0,
so führt das Regelgesetz
of order n with the degree zero. If the Lie derivatives L n | fh ( x ) and L g L n-1 | fh ( x ) exist in a certain area of the state space and L g L n-1 | fh ( x ) = const in the relevant area. ≠ 0, the rule of law leads
für diesen Bereich des Zustandsraumes zu der Fehlerdifferentialgleichung
for this area of the state space to the error differential equation
Der Beweis dieses Hilfssatzes beruht auf der Theorie der Input-Output-Linearisierung (s. J. Slotine und W. Li, Applied Nonlinear Control) und soll hier nicht weiter ausgeführt werden.The proof of this auxiliary sentence is based on the theory of input-output linearization (see J. Slotine and W. Li, Applied Nonlinear Control) and will not be discussed further here.
Der folgende Satz stellt für das Adaptionsgesetz (8)-(9) die Stabilität sicher:The following sentence ensures stability for the adaptation law (8) - (9):
Gegeben sei ein adaptives System aus einer Strecke vom Typ (14)-(15), einem Referenzmodell nach
Gl. (12), einem adaptiven Fuzzy-Regler nach Gl. (13) und dem Adaptionsgesetz (8)-(9). Dann gilt:
Given an adaptive system from a line of type (14) - (15), a reference model according to Eq. (12), an adaptive fuzzy controller according to Eq. (13) and the Adaptation Act (8) - (9). Then:
- 1. Wenn der inhärente Approximationsfehler d hinreichend klein ist, so sind der Parametervektor θ und der Hilfsparameter p beschränkt.1. If the inherent approximation error d is sufficiently small, the parameter vector θ and the auxiliary parameter p are limited.
- 2. Wenn d ∼ 0 ist und ξ und uaux beschränkt sind, so ist limt→∞ e = 0.2. If d ∼ is 0 and ξ and u aux are constrained, then lim t → ∞ e = 0.
Unter Verwendung von Hilfssatz 1 erhält man für das beschriebene System folgende Differentialgleichung
für den Fehler e:
Using auxiliary sentence 1, the following differential equation for the error e is obtained for the system described:
d. h.
ie
Für den erweiterten Fehler e* ergibt sich
For the extended error e * results
hierbei ist der erweiterte Parameterfehler
here is the extended parameter error
und der erweiterte Aktivierungsvektor
and the extended activation vector
Aus dem Adaptionsgesetz (8)-(9) ergibt sich
From the adaptation law (8) - (9) follows
mit
With
Zum Nachweis der Beschränktheit von
To demonstrate the limitation of
wird die Ljapunow-Funktion
becomes the Lyapunov function
verwendet. Ihre Ableitung nach der Zeit ist
used. Your derivative is after time
Ist d hinreichend klein, so ist ≦ 0; damit ist die Beschränktheit von
If d is sufficiently small, then ≦ 0; with that the limitation of
und somit die Beschränktheit von θ und p nachgewiesen.and thus the limitation of θ and p is demonstrated.
Um zu zeigen, daß limt→∞ e = 0 ist, wird zunächst bewiesen, daß limt→∞ e* = 0 ist. (Im folgenden wird
von d ∼ 0 ausgegangen.) Hierzu wird die zweite Ableitung von V berechnet:
To show that lim t → ∞ e = 0, we first prove that lim t → ∞ e * = 0. (In the following, d ∼ 0 is assumed.) For this, the second derivative of V is calculated:
Aus der Beschränktheit von ξ und uaux (s. Voraussetzung) und der Beschränktheit von
From the restriction of ξ and u aux (see prerequisite) and the restriction of
folgt die Be
schränktheit von
follows the limitation of
und damit die Beschränktheit von . Aus dem Lemma von Barbalat (s. J. Slotine und W. Li, Applied Nonlinear Control) folgt nun aber, daß dann limt→∞ = limt→∞(-e*2) = 0 sein muß. Damit ist auch limt→∞ e* = 0.and thus the limitation of. From Barbalat's lemma (see J. Slotine and W. Li, Applied Nonlinear Control) it follows that lim t → ∞ = lim t → ∞ (-e * 2 ) = 0. Hence lim t → ∞ e * = 0.
Als nächster Schritt wird limt→∞ eaux = 0 bewiesen. In K. Narendra und A. Annaswamy, Siable Adaptive
Systems, wird gezeigt, daß dies der Fall ist, wenn ξ beschränkt und
The next step is lim t → ∞ e aux = 0. K. Narendra and A. Annaswamy, Siable Adaptive Systems, show that this is the case when ξ is restricted and
quadratisch integrierbar ist. Die
quadratische Integrierbarkeit von
can be integrated into a square. The square integrability of
ergibt sich aus
results from
Somit ist e* quadratisch integrierbar; da
Thus e * can be integrated into a square; there
und ξ f beschränkt ist, ist auch
and ξ f is limited, too
quadratisch inte grierbar. Damit ist nachgewiesen, daß limt→∞ eaux = 0 ist.square integrable. This proves that lim t → ∞ e aux = 0.
Schließlich kann mit derselben Argumentation gezeigt werden, daß auch limt→∞((p uaux)f - puauxf) = 0 ist. Mit (10) folgt aus diesen Teilergebnissen limt→∞ e = 0, womit Satz 1 bewiesen ist.Finally, the same reasoning can be used to show that lim t → ∞ (( p u aux ) f - p u auxf ) = 0. With (10) follows from these partial results lim t → folgt e = 0, which proves Theorem 1.
Für das Regelgesetz (4) lautet das entsprechende Adaptionsgesetz
For the regulation law (4) the corresponding adaptation law is
mit
With
Der Hilfsparameter p und das Hilfssignal uaux können hier entfallen. Die Adaption von θ 2 ist bei Unter schreiten einer vorgegebenen unteren Schranke anzuhalten, um eine Division durch Null im Regelgesetz zu verhindern.The auxiliary parameter p and the auxiliary signal u aux can be omitted here. The adaptation of θ 2 is to be stopped when falling below a predetermined lower limit in order to prevent division by zero in the control law.
Für das Regelgesetz (6) lautet das Adaptionsgesetz
For the regulation law (6) is the adaptation law
mit
With
(Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.) (The mathematical equations given here are only intended to illustrate the basic principle of the method clarify. The practical implementation can be done according to these equations or by others mathematical representations that implement the same basic principle.)
Ein weiteres Problem der stabilen adaptiven Fuzzy-Regelung bestand bislang darin, daß sie auf Strecken mit
Stellgrößenbegrenzung nicht anwendbar war. Die Herleitung des Verfahrens geht davon aus, daß beliebig hohe
Stellamplituden möglich sind; Simulationen zeigen, daß das Vorhandensein einer Stellgrößenbegrenzung
zu Instabilität (d. h. unbeschränktem Anwachsen der zu adaptierenden Parameter) führt. Das resultieren
de Regelungsverhalten ist durch ständiges Hin- und Herschalten der Stellgröße zwischen positiver und
negativer Begrenzung gekennzeichnet. Auch dieses Problem konnte jedoch durch eine Weiterentwicklung
des Adaptionsgesetzes gelöst werden. Die Modifikation beruht im wesentlichen auf einer Abschaltung der
Adaption während der Begrenzungsphase sowie der Verwendung eines modifizierten Referenzsignals. Das
Adaptionsgesetz (8) wird modifiziert zu
Another problem with stable adaptive fuzzy control has so far been that it was not applicable to lines with manipulated variable limitation. The derivation of the method assumes that actuation amplitudes of any desired height are possible; Simulations show that the existence of a manipulated variable limit leads to instability (ie unlimited increase in the parameters to be adapted). The resulting control behavior is characterized by constant switching of the manipulated variable between positive and negative limitation. However, this problem could also be solved by further developing the adaptation law. The modification is essentially based on switching off the adaptation during the limitation phase and using a modified reference signal. The adaptation law (8) is modified to
das Adaptionsgesetz (9) wird entsprechend modifiziert. Die Bedingung (ue*ξ f < 0 ∧ |e| < εe) wird benötigt, um ein "Hängenbleiben" in der Stellgrößenbegrenzung zu verhindern, falls alle aktiven Parameter durch Überschwingen < umax (oder < -umax) werden sollten. In diesem Fall wird der Fehler irgendwann < εe, und die Parameter verlassen die Begrenzung wieder. Theoretisch könnte εe, auf Null gesetzt werden; Simulationsergebnisse haben jedoch gezeigt, daß ein Wert von εe = (0.1 . . . 1.0) . max(|ym(t)|) zu einem besseren Verhalten der Parameter führt. Wird εe zu Null gesetzt, ist die Adaption für Parameter, die von der Begrenzung betroffen sind, "unsymmetrisch" (Adaption zu Null hin ist möglich, während Adaption von Null weg während der Begrenzung nicht möglich ist); dies führt in Verbindung mit dem inhärenten Approximationsfehler zu oszillatorischem Verhalten der Parameter.the adaptation law (9) is modified accordingly. The condition (ue * ξ f <0 ∧ | e | <ε e ) is required in order to prevent "getting stuck" in the manipulated variable limitation if all active parameters should become <u max (or <-u max ) due to overshoot. In this case the error becomes <ε e at some point and the parameters leave the limit again. Theoretically, ε e , could be set to zero; However, simulation results have shown that a value of ε e = (0.1 ... 1.0). max (| y m (t) |) leads to better behavior of the parameters. If ε e is set to zero, the adaptation for parameters that are affected by the limitation is "asymmetrical" (adaptation to zero is possible, whereas adaptation away from zero is not possible during the limitation); in connection with the inherent approximation error, this leads to oscillatory behavior of the parameters.
Weiterhin muß zur Erreichung stabilen Verhaltens ein modifiziertes Referenzsignal ymm eingeführt wer den. Das modifizierte Referenzmodell hat die gleiche Dynamik wie das ursprüngliche Modell, aber seine Zustände ymm, mm, mm, . . . y (n-1)|mm werden auf y, , , . . . y(n-1) zurückgesetzt, wenn u die Begrenzung verläßt (In der Praxis wird das Referenzmodell zeitdiskret realisiert. Wenn u die Begrenzung verläßt, werden seine Zustände ymm(k) . . . ymm(k - n + 1) auf y(k) . . . y(k - n + 1) zurückgesetzt. Es ist also keine Differentiation von y erforderlich). Gleichzeitig werden die Zustände der linearen Filter für ξ f und (θ T ξ)f auf Null zurückgesetzt. (Die hier angegebenen mathematischen Gleichungen sollen nur das grundsätzliche Prinzip des Verfahrens verdeutlichen. Die praktische Realisierung kann nach diesen Gleichungen erfolgen oder auch durch andere mathematische Darstellungsweisen, die dasselbe Grundprinzip realisieren.)Furthermore, a modified reference signal y mm must be introduced to achieve stable behavior. The modified reference model has the same dynamics as the original model, but its states y mm , mm , mm,. . . y (n-1) | mm are on y,,,. . . y (n-1) is reset when u leaves the limit (In practice, the reference model is implemented in a time-discrete manner. When u leaves the limit, its states y mm (k) ... y mm (k - n + 1) open y (k) ... y (k - n + 1), so no differentiation of y is required). At the same time, the states of the linear filters for ξ f and ( θ T ξ ) f are reset to zero. (The mathematical equations given here are only intended to clarify the basic principle of the method. The practical implementation can be carried out according to these equations or by other mathematical representations which implement the same basic principle.)
Im folgenden soll nun die Funktionsweise des beschriebenen Verfahrens an einem Anwendungsbeispiel ver deutlicht werden. Als unbekannte nichtlineare Strecke wurde ein Antriebssystem mit nichtlinearer Reibung verwendet (Abb. 2). Das Antriebssystem stellt einen Zwei-Massen-Torsionsschwinger dar. Die zu regeln de Ausgangsgröße ist die Drehzahl der Lastmasse x1; die weiteren Zustandsgrößen sind der Verdrehwinkel der Welle x2 und die Motordrehzahl x3. Auf die Motormasse wirkt als Stellgröße das Luftspaltmoment u (Annahme: ideale Momentenregelung); der Betrag von u ist auf den Maximalwert umax = 5,0 begrenzt. Auf die Lastmasse wirkt ein Reibmoment ff(x1), welches nichtlinear von der Lastdrehzahl x1 abhängt. Die Reibungskennlinie wurde durch die Arcustangens-Funktion modelliert. Die Torsionseigenfrequenz beträgt ca. 50 Hz; die Dämpfung der Welle wurde zu Null angenommen.In the following, the operation of the described method will now be illustrated using an application example. A drive system with non-linear friction was used as the unknown non-linear path ( Fig. 2). The drive system is a two-mass torsional vibrator. The output variable to be controlled is the speed of the load mass x 1 ; the other state variables are the angle of rotation of the shaft x 2 and the motor speed x 3 . The air gap torque u acts on the engine mass as a manipulated variable (assumption: ideal torque control); the amount of u is limited to the maximum value u max = 5.0. A friction torque f f (x 1 ) acts on the load mass, which depends non-linearly on the load speed x 1 . The friction characteristic was modeled using the arctangent function. The natural torsional frequency is approx. 50 Hz; the wave damping was assumed to be zero.
Der Entwurf des Referenzmodells erfolgte nach der Methode der Doppelverhältnisse; die Ersatzzeitkon stante des Referenzmodells wurde zu Tm = 20 ms vorgegeben.The design of the reference model was based on the double ratio method; the equivalent time constant of the reference model was specified as T m = 20 ms.
Unter Ausnutzung des Vorwissens, daß die nichtlineare Reibung nur von x1, aber nicht von x2 und x3
abhängt, wurde ein Regelgesetz der Form
Taking advantage of the prior knowledge that the nonlinear friction depends only on x 1 , but not on x 2 and x 3 , a rule law of the form became
aufgestellt, bei dem alle unbekannten nichtlinearen Funktionen nur noch von x1 abhängen. Für jede der unbekannten nichtlinearen Teilfunktionen wurde ein Funktionsapproximator mit 10 dreieckförmigen Basis funktionen verwendet. in which all unknown nonlinear functions only depend on x 1 . A function approximator with 10 triangular base functions was used for each of the unknown nonlinear subfunctions.
Simulationsergebnisse für diesen Regler sind in Abb. 3 zu sehen. Der Regler wird durch Aufschalten eines Sollwertsignals w(t) trainiert, das alle 40 ms einen neuen Zufallswert im Bereich [-0,5, 0,5] annimmt. Nach 300, 1800 und 7200 s wird ein dreieckförmiges Testsignal aufgeschaltet, um das erreichte Lernergebnis zu beurteilen.Simulation results for this controller can be seen in Fig. 3. The controller is trained by applying a setpoint signal w (t) which assumes a new random value in the range [-0.5, 0.5] every 40 ms. A triangular test signal is applied after 300, 1800 and 7200 s to assess the learning result achieved.
Um zu demonstrieren, daß Stabilität und Konvergenz unabhängig von den Anfangsbedingungen sind,
werden die Parametervektoren θ 2, θ 3, θ 4 und θ 5 aus (38) auf Null initialisiert; θ1 wird auf den Anfangswert
106 gesetzt. Es wird also keinerlei Vorwissen über die Parameter der Strecke zugrundegelegt. Zu Beginn der
Adaption ist das Regelgesetz also
In order to demonstrate that stability and convergence are independent of the initial conditions, the parameter vectors θ 2 , θ 3 , θ 4 and θ 5 from (38) are initialized to zero; θ 1 is set to the initial value 10 6 . So no previous knowledge of the parameters of the route is used. At the beginning of the adaptation there is the rule law
es erfolgt somit lediglich eine Steuerung mit dem Sollwert w. Wie bereits erwähnt, geht der Adaptions vorgang in der Anfangsphase relativ schnell vonstatten. Nach ca. 300 s folgt die Lastdrehzahl bereits grob dem Referenzsignal ym. Danach wird die Adaption jedoch wesentlich langsamer. Auch nach 1800 s sind - besonders im Bereich kleinerer Drehzahlen - noch deutliche Abweichungen zwischen y und ym zu erkennen. Nach ca. 7200 s (d. h. zwei Stunden) sind Lastdrehzahl und Referenzsignal für den dreieckförmigen Sollwert verlauf praktisch deckungsgleich. Die verbleibenden Abweichungen bei zufallsverteiltem Sollwertverlauf sind auf die Stellgrößenbegrenzung zurückzuführen. Die Adaption wird bei Erreichen der Stellgrößenbegrenzung angehalten (s. 2.1.5); wie man sieht, bleiben durch diese Maßnahme Stabilität und Konvergenz erhalten, obwohl die Stellgrößenbegrenzung (aufgrund der schnellen Einstellung des Referenzmodells) bei fast jedem Sollwertsprung erreicht wird.it is therefore only controlled with the setpoint w. As already mentioned, the adaptation process takes place relatively quickly in the initial phase. After approx. 300 s, the load speed already roughly follows the reference signal y m . After that, however, the adaptation becomes much slower. Even after 1800 s, clear deviations between y and y m can still be seen, especially in the range of lower speeds. After approx. 7200 s (ie two hours), the load speed and the reference signal for the triangular setpoint are practically congruent. The remaining deviations in the case of a randomly distributed setpoint curve are due to the manipulated variable limitation. The adaptation is stopped when the manipulated variable limit is reached (see 2.1.5); As you can see, this measure maintains stability and convergence, although the manipulated variable limitation (due to the quick setting of the reference model) is achieved with almost every setpoint step change.
Claims (5)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE1996141066 DE19641066A1 (en) | 1996-10-04 | 1996-10-04 | Direct adaptive control of non linear system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE1996141066 DE19641066A1 (en) | 1996-10-04 | 1996-10-04 | Direct adaptive control of non linear system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE19641066A1 true DE19641066A1 (en) | 1998-04-23 |
Family
ID=7807931
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE1996141066 Withdrawn DE19641066A1 (en) | 1996-10-04 | 1996-10-04 | Direct adaptive control of non linear system |
Country Status (1)
| Country | Link |
|---|---|
| DE (1) | DE19641066A1 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19942144A1 (en) * | 1999-09-03 | 2001-06-07 | Schroeder Dierk | Method to identify and suppress oscillations or rotational irregularities involves identifying oscillation curve using intelligent method of non-linear functional approximation, e.g. neuronal net |
-
1996
- 1996-10-04 DE DE1996141066 patent/DE19641066A1/en not_active Withdrawn
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19942144A1 (en) * | 1999-09-03 | 2001-06-07 | Schroeder Dierk | Method to identify and suppress oscillations or rotational irregularities involves identifying oscillation curve using intelligent method of non-linear functional approximation, e.g. neuronal net |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69315423T2 (en) | Neuro-Pid controller | |
| DE69803606T2 (en) | METHOD FOR PREDICTING OVERVOLTAGE IN A CONTROL SYSTEM | |
| EP2106576B1 (en) | Method for the computer-assisted control and/or regulation of a technical system | |
| DE69413812T2 (en) | Fuzzy logic based control method for power supplies and device for carrying it out | |
| DE19531692C2 (en) | Methods for the observation of immeasurable quantities of nonlinear dynamic systems | |
| DE19606480C2 (en) | Method and arrangement for adapting a fuzzy controller | |
| DE69400710T2 (en) | Fuzzy logic control method or device for an induction motor | |
| DE10261727A1 (en) | Control system in fuzzy logic for a wheel of a motor vehicle and method for implementing a fuzzy logic unit for such a wheel of a motor vehicle | |
| DE68918885T2 (en) | Device for generating process control signals from process variable signals. | |
| DE2347741A1 (en) | PROCESS REGULATION ORGANIZATION WITH AUTOMATIC ADAPTATION TO UNKNOWN OR CHANGEABLE PARAMETERS | |
| EP0998700B1 (en) | Method for generating connecting paths which can be used for guiding a vehicle to a predetermined target path | |
| EP0520233B1 (en) | Arrangement for identification of a controlled system | |
| DE2510837C3 (en) | Device for regulating control systems with dead time | |
| EP0708936B1 (en) | Arrangement for modelling a non-linear process | |
| EP3542229B1 (en) | Device and method for determining the parameters of a control device | |
| EP1119799A1 (en) | Controlling system for regulating a system with several coupled controlled variables | |
| EP2933502B1 (en) | Digital hydraulic drive system | |
| DE3742686A1 (en) | DEVICE FOR MODEL-CONTROLLED CONTROL OF A ROBOT | |
| DE1523535C3 (en) | Self-adapting control loop | |
| EP0752630A1 (en) | Self-adjusting controlling device and method for the self-adjustment of this device | |
| DE112021004158T5 (en) | Control support device, control system and control support method | |
| DE19641066A1 (en) | Direct adaptive control of non linear system | |
| DE4229280A1 (en) | FUZZY FEEDBACK CONTROL DEVICE | |
| DE102016111065A1 (en) | Control method with model-based anti-windup | |
| EP0614547B1 (en) | Process for regulating nth-order dynamic systems |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| 8122 | Nonbinding interest in granting licenses declared | ||
| 8139 | Disposal/non-payment of the annual fee |