DE102024204002A1 - ROBUST ADAPTIVE CONTROL FOR INDEFINITE TIME-DELAYED CONTROL SYSTEMS - Google Patents
ROBUST ADAPTIVE CONTROL FOR INDEFINITE TIME-DELAYED CONTROL SYSTEMSInfo
- Publication number
- DE102024204002A1 DE102024204002A1 DE102024204002.9A DE102024204002A DE102024204002A1 DE 102024204002 A1 DE102024204002 A1 DE 102024204002A1 DE 102024204002 A DE102024204002 A DE 102024204002A DE 102024204002 A1 DE102024204002 A1 DE 102024204002A1
- Authority
- DE
- Germany
- Prior art keywords
- time
- indefinitely
- observer
- determined
- controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/404—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control arrangements for compensation, e.g. for backlash, overshoot, tool offset, tool wear, temperature, machine construction errors, load, inertia
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/37—Measurements
- G05B2219/37512—Correction for detection delay
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/41—Servomotor, servo controller till figures
- G05B2219/41141—Position error compensation as function of speed to compensate detection delay
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Manufacturing & Machinery (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Feedback Control In General (AREA)
Abstract
Offenbart wird ein computer-implementiertes Verfahren für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt zeitverzögerten Systems, insbesondere wobei das unbestimmt zeitverzögerte System einen Regler, optional einen Beobachter, und ein zu regelndes technische System umfasst, wobei der Regler und/oder der Beobachter zumindest teilweise über ein Kommunikationsnetzwerk mit dem zu regelnden technischen System kommunizieren, das Verfahren umfassend: Empfangen einer für einen ersten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten Zeitverzögerung und einer für einen zweiten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten Zeitverzögerung, wobei der zweite Zeitpunkt später als der erste Zeitpunkt ist; Bestimmen von einen oder mehreren Übergangswahrscheinlichkeiten für Übergänge von Zeitverzögerungen zum ersten Zeitpunkt zu Zeitverzögerungen zum zweiten Zeitpunkt basierend auf der für den ersten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten Zeitverzögerung und der für den zweiten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten Zeitverzögerung; und Bestimmen einer oder mehrerer Ambiguitätsmengen um die einen oder mehreren bestimmten Übergangswahrscheinlichkeiten. A computer-implemented method for robust adaptive control and/or a robust adaptive observer of an indefinitely time-delayed system is disclosed, in particular wherein the indefinitely time-delayed system comprises a controller, optionally an observer, and a controlled technical system, wherein the controller and/or the observer communicate at least partially with the controlled technical system via a communication network, the method comprising: receiving a time delay determined for a first time point for the indefinitely time-delayed system and a time delay determined for a second time point for the indefinitely time-delayed system, wherein the second time point is later than the first time point; determining one or more transition probabilities for transitions from time delays at the first time point to time delays at the second time point based on the time delay determined for the first time point for the indefinitely time-delayed system and the time delay determined for the second time point for the indefinitely time-delayed system; and determining one or more ambiguity sets around the one or more determined transition probabilities.
Description
Stand der TechnikState of the art
In den letzten Jahrzehnten hat die rasante Entwicklung der Rechnerkapazität und der Kommunikationstechnologie die heutige Infrastruktur von Regelsystemen stark beeinflusst. Während herkömmliche Regelsysteme aus Sensoren, Reglern und Aktoren bestehen, die über Drähte miteinander verbunden sind, ersetzt ein vernetztes Regelungssystem (im Englischen: networked control system, NCS) zumindest einen Teil oder alle dieser Ende-zu-Ende-Verbindungen durch ein Kommunikationsnetzwerk. NCS können, müssen aber nicht auf drahtlosen Verbindungen basieren. Weiterhin werden auch zum Beispiel zentralisierte und/oder zonen basierte E/E-Architekturen von NCS erfasst.In recent decades, the rapid development of computing power and communication technology has significantly influenced the infrastructure of today's control systems. While conventional control systems consist of sensors, controllers, and actuators connected by wires, a networked control system (NCS) replaces at least some or all of these end-to-end connections with a communication network. NCS can be based on wireless connections, but this is not mandatory. Furthermore, centralized and/or zone-based E/E architectures, for example, are also encompassed by NCS.
Die Vorteile eines NCS sind vielfältig, z.B. wird der Verkabelungs- und/oder Wartungsaufwand reduziert, während die Kommunikationstopologie mehr Flexibilität im Hinblick auf verteilte Systeme ermöglicht. Allerdings können bei der Verwendung eines Kommunikationsnetzwerks zum Beispiel die folgenden netzwerkbedingten Probleme auftreten:
- - Zufällige Übertragungsverzögerung in den Kanälen Sensor-zu-Steuerung (S2C) und Steuerung-zu-Aktor (C2A), z. B. aufgrund großer Entfernungen zwischen zwei Knoten und/oder zeitlich variierendem Verkehr im Netz.
- - Zufällige Paketverluste, z. B. aufgrund von Netzüberlastungen.
- - Random transmission delay in the sensor-to-controller (S2C) and controller-to-actuator (C2A) channels, e.g. due to large distances between two nodes and/or time-varying traffic in the network.
- - Random packet loss, e.g. due to network congestion.
Ein solches Regelsystem kann als unbestimmt zeitverzögertes Regelsystem bezeichnet werden.Such a control system can be described as an indefinitely time-delayed control system.
Beide Probleme können, wenn sie nicht aktiv behandelt werden, die Leistung des Regelsystems verschlechtern und sogar zu einer Instabilität des Regelkreises führen. Ebenso kann es in diesem Fall dazu kommen, dass ein Beobachter (im Englischen: observer) im Regelsystem nicht mehr richtig funktioniert.Both problems, if left unaddressed, can degrade the performance of the control system and even lead to instability of the control loop. Similarly, in this case, an observer within the control system may malfunction.
In der Vergangenheit wurden verschiedene Regelungsansätze entwickelt, um mit zufälligen Zeitverzögerungen und/oder Paketausfällen umgehen zu können, die von deterministischen bis zu stochastischen Ansätzen reichen. Während sich deterministische (robuste) Ansätze auf die Beschreibung der Ungewissheit im schlimmsten Fall stützen, verwenden stochastische Ansätze zusätzliche Informationen in Form von Statistiken und/oder Wahrscheinlichkeitsverteilungen, um eine weniger konservative Regelung zu erhalten. Allerdings setzt der stochastische Ansatz in der Regel vollständige Informationen über die Statistiken und/oder Wahrscheinlichkeitsverteilung der Zeitverzögerung in einem bestimmten Regelsystem voraus, was ihn in der Praxis leider kaum anwendbar macht. Verwendet man hingegen empirische Schätzungen der Statistiken und/oder der Wahrscheinlichkeitsverteilung, können keine Garantien für das Regelsystem gegeben werden. Solche Garantien sind aber gerade für die Freigabe des Regelsystems erforderlich.In the past, various control approaches have been developed to deal with random time delays and/or packet loss, ranging from deterministic to stochastic approaches. While deterministic (robust) approaches rely on describing the worst-case uncertainty, stochastic approaches use additional information in the form of statistics and/or probability distributions to achieve less conservative control. However, the stochastic approach typically requires complete information about the statistics and/or probability distribution of the time delay in a given control system, which unfortunately makes it rarely applicable in practice. Conversely, if empirical estimates of the statistics and/or probability distribution are used, no guarantees can be given for the control system. Such guarantees, however, are precisely what is needed to release the control system.
Daher kann ein zu lösendes Problem, das der Offenbarung zugrunde liegt, zum Beispiel darin gesehen werden, ein Verfahren bereitzustellen, das - z.B. trotz initialer Unkenntnis der Statistiken und/oder Wahrscheinlichkeitsverteilung von Zeitverzögerungen im Regelsystem - eine nicht zu konservative, aber dennoch robuste Regelung für ein unbestimmt zeitverzögertes Regelsystem ermöglicht. Alternativ oder zusätzlich kann ein zu lösendes Problem auch darin gesehen werden, ein Verfahren bereitzustellen, das - z.B. trotz initialer Unkenntnis der Statistiken und/oder Wahrscheinlichkeitsverteilung von Zeitverzögerungen im Regelsystem - eine nicht zu konservative, aber dennoch robuste Auslegung eines Beobachters in einem unbestimmt zeitverzögerten Regelsystem ermöglicht. Ein zu lösendes Problem kann auch darin gesehen werden, eine Regelung und einen Beobachter eines unbestimmt zeitverzögerten Systems bereitzustellen, die insgesamt nicht zu konservativ aber dennoch robust sind.Therefore, a problem to be solved underlying the disclosure can be seen, for example, as providing a method that—despite initial lack of knowledge of the statistics and/or probability distribution of time delays in the control system—enables a not overly conservative, yet robust, control system for an indefinitely time-delayed control system. Alternatively or additionally, a problem to be solved can also be seen as providing a method that—despite initial lack of knowledge of the statistics and/or probability distribution of time delays in the control system—enables a not overly conservative, yet robust, design of an observer in an indefinitely time-delayed control system. A problem to be solved can also be seen as providing a control system and an observer for an indefinitely time-delayed system that are, overall, not overly conservative, yet robust.
Offenbarung der ErfindungDisclosure of the invention
Ein erster allgemeiner Aspekt der vorliegenden Offenbarung betrifft ein computer-implementiertes Verfahren für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt zeitverzögerten Systems. Das unbestimmt zeitverzögerte System kann einen Regler und optional einen Beobachter sowie ein zu regelndes technische System umfassen, wobei der Regler und/oder der Beobachter zumindest teilweise über ein Kommunikationsnetzwerk mit dem zu regelnden technischen System kommunizieren. Das Verfahren umfasst Empfangen, insbesondere über eine erste Kommunikationsschnittstelle, einer für einen ersten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten, insbesondere gemessenen, Zeitverzögerung und einer für einen zweiten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten, insbesondere gemessenen, Zeitverzögerung, wobei der zweite Zeitpunkt später als der erste Zeitpunkt ist. Die für den ersten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelte Zeitverzögerung und die für den zweiten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelte Zeitverzögerung können diskret sein. Das Verfahren umfasst weiterhin Bestimmen von einen oder mehreren Übergangswahrscheinlichkeiten für Übergänge von Zeitverzögerungen zum ersten Zeitpunkt zu Zeitverzögerungen zum zweiten Zeitpunkt basierend auf der für den ersten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten Zeitverzögerung und der für den zweiten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten Zeitverzögerung. Zusätzlich kann das Bestimmen der einen oder mehreren Übergangswahrscheinlichkeiten auf einer oder mehreren zu früheren als den ersten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelten Zeitverzögerungen basieren. Das Verfahren umfasst weiterhin Bestimmen einer oder mehrerer Ambiguitätsmengen um die einen oder mehreren bestimmten Übergangswahrscheinlichkeiten.A first general aspect of the present disclosure relates to a computer-implemented method for robust adaptive control and/or a robust adaptive observer of an indefinitely time-delayed system. The indefinitely time-delayed system can comprise a controller and optionally an observer, as well as a technical system to be controlled, wherein the controller and/or the observer communicate with the technical system to be controlled, at least partially, via a communication network. The method includes receiving, in particular via a first communication interface, a time delay determined, in particular measured, for a first time point for the indefinitely time-delayed system, and a time delay determined, in particular measured, for a second time point for the indefinitely time-delayed system, wherein the second time point is later than the first time point. The time delay determined for the first time point for the indefinitely time-delayed system and the time delay determined for the second time point for the indefinitely time-delayed system can be discrete. The procedure further includes determining one or more transition probabilities for transitions from time delays at the first time to time delays at the second time based on The procedure involves determining the time delay for the first time point for the indefinitely time-delayed system and the time delay for the second time point for the indefinitely time-delayed system. Additionally, determining one or more transition probabilities can be based on one or more time delays determined for earlier times than the first time point for the indefinitely time-delayed system. The procedure further includes determining one or more ambiguity sets around the one or more determined transition probabilities.
Ein zweiter allgemeiner Aspekt der vorliegenden Offenbarung betrifft einen Regler und/oder Beobachter, die dafür konfiguriert sind, ein technisches System zu regeln, wobei der Regler und/oder der Beobachter zumindest teilweise über ein Kommunikationsnetzwerk mit dem zu regelnden technischen System kommunizieren. Der Regler und/oder der Beobachter umfassen eine zweite Kommunikationsschnittstelle, um Information an eine Recheneinheit, insbesondere an eine Recheneinheit außerhalb eines unbestimmt zeitverzögerten Systems umfassend den Regler und/oder den Beobachter, zu senden, aus der eine Zeitverzögerung für einen ersten Zeitpunkt für das unbestimmt zeitverzögerte System und eine Zeitverzögerung für einen zweiten Zeitpunkt für das unbestimmt zeitverzögerte System ermittelt werden können, wobei der zweite Zeitpunkt später als der erste Zeitpunkt ist. Die zweite Kommunikationsschnittstelle kann weiterhin dafür ausgelegt sein, ein Update von der Recheneinheit zu erhalten, wobei das Update einen angepassten Regler und/oder einen angepassten Beobachter umfasst. Der Regler und/oder der Beobachter können dafür ausgelegt sein, das Update zu implementieren.A second general aspect of the present disclosure relates to a controller and/or observer configured to control a technical system, wherein the controller and/or observer communicate with the technical system to be controlled, at least partially, via a communication network. The controller and/or observer comprise a second communication interface for sending information to a computing unit, in particular a computing unit outside an indefinitely time-delayed system comprising the controller and/or observer, from which a time delay for a first time point for the indefinitely time-delayed system and a time delay for a second time point for the indefinitely time-delayed system can be determined, the second time point being later than the first time point. The second communication interface can further be configured to receive an update from the computing unit, wherein the update comprises a modified controller and/or an modified observer. The controller and/or observer can be configured to implement the update.
Ein dritter allgemeiner Aspekt der vorliegenden Offenbarung betrifft eine Recheneinheit (mithin ein Computer-System), die dafür ausgelegt ist, das computer-implementierte Verfahren für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt zeitverzögerten Systems nach dem ersten allgemeinen Aspekt (oder einer Ausführungsform davon) auszuführen. Die Recheneinheit umfasst eine erste Kommunikationsschnittstelle. Ein vierter allgemeiner Aspekt der vorliegenden Offenbarung betrifft ein Computer-Programm, das dafür ausgelegt ist, das computer-implementierte Verfahren für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt zeitverzögerten Systems nach dem ersten allgemeinen Aspekt (oder einer Ausführungsform davon) auszuführen.A third general aspect of the present disclosure relates to a computing unit (i.e., a computer system) designed to execute the computer-implemented method for robust adaptive control and/or a robust adaptive observer of an indefinitely time-delayed system according to the first general aspect (or an embodiment thereof). The computing unit includes a first communication interface. A fourth general aspect of the present disclosure relates to a computer program designed to execute the computer-implemented method for robust adaptive control and/or a robust adaptive observer of an indefinitely time-delayed system according to the first general aspect (or an embodiment thereof).
Ein fünfter allgemeiner Aspekt der vorliegenden Offenbarung betrifft ein computer-lesbares Medium oder Signal, das das Computer-Programm nach dem vierten allgemeinen Aspekt (oder einer Ausführungsform davon) speichert und/oder enthält.A fifth general aspect of the present disclosure relates to a computer-readable medium or signal that stores and/or contains the computer program according to the fourth general aspect (or an embodiment thereof).
Durch das hier vorgeschlagene Verfahren nach dem ersten allgemeinen Aspekt (oder einer Ausführungsform davon) können eine robuste adaptive Regelung und/oder ein robuster adaptiver Beobachter eines unbestimmt zeitverzögerten Systems sukzessive angepasst und schlussendlich definiert werden, wobei unbestimmte Zeitverzögerungen durch das Kommunikationsnetzwerk zwischen Regler/Beobachter (nachfolgend auch als stochastische Regler bezeichnet) und dem zu regelnden technischen System entstehen können. Der definierte Regler ist robust, weil er mit einer Vielzahl von Wahrscheinlichkeitsverteilungen der Zeitverzögerungen umgehen kann. Zugleich sind sie nicht zu konservativ, da sie nicht auf alle theoretisch möglichen Zeitverzögerungen (und deren Abfolgen) gleichermaßen ausgelegt sind, sondern auf die im Anwendungsfall statistisch relevanten. Der definierte Regler und/oder der definierte Beobachter können dann bereits als freigeben betrachtet werden oder in einem Freigabeprozess weiter untersucht werden und daraufhin gegebenenfalls freigegeben werden. Die Freigabe des Reglers und/oder des Beobachters kann ein notwendiger Teil für die Freigabe des zu regelnden technischen Systems sein.The method proposed here, according to the first general aspect (or an embodiment thereof), allows for the successive adaptation and eventual definition of a robust adaptive controller and/or a robust adaptive observer of an indeterminate time-delayed system. Indeterminate time delays can arise from the communication network between the controller/observer (hereinafter also referred to as stochastic controllers) and the controlled technical system. The defined controller is robust because it can handle a multitude of probability distributions of the time delays. At the same time, it is not overly conservative, as it is not designed to accommodate all theoretically possible time delays (and their sequences) equally, but rather those that are statistically relevant in the application. The defined controller and/or the defined observer can then be considered enabled or further investigated in an enablement process and subsequently enabled, if necessary. Enabling the controller and/or the observer can be a necessary step for enabling the controlled technical system.
Das Hauptproblem beim Entwurf von stochastischen Reglern in der Praxis ist die Notwendigkeit, die wahre Statistik(en) und/oder Wahrscheinlichkeitsverteilung(en) von Zeitverzögerungen bereits zum Zeitpunkt der Auslegung der Regelung zu kennen. Diese sind jedoch in der Realität fast nie gegeben und erfordern Näherungen, z.B. in Form der empirischen Verteilung, die aber leider stichprobeninduzierten Fehlern unterliegt, die sich aus der Stichprobenmittelwertnäherung ergeben. Um trotz dieser stichprobenbedingten Fehler garantierte stabilisierende Regler synthetisieren zu können, wird erfindungsgemäß ein verteilungsrobuster Ansatz verfolgt. Dabei wird insbesondere zu jeweils einem Zeitpunkt eine Ambiguitätsmenge (im Englischen: ambiguity set) konstruiert, d.h. eine Unsicherheitsmenge im Raum der Wahrscheinlichkeitsverteilungen, um eine empirische Schätzung herum, die die wahre Wahrscheinlichkeitsverteilung mit einer hohen Konfidenz enthält. Dadurch wird erreicht, dass der resultierende Regler und/oder Beobachter - mithin das unbestimmt zeitverzögerte Regelsystem - zu jedem Zeitpunkt robust gegenüber einer ganzen Familie von Wahrscheinlichkeitsverteilungen sind. Im geschlossenen Regelkreis werden kontinuierlich Daten (insbesondere tatsächlich auftretende Zeitverzögerungen, d.h. Zeitverzögerungsdaten) vom Regelsystem gesammelt. Daraufhin werden die empirische Verteilung und die Ambiguitätsmenge aus den Daten kontinuierlich adaptiert, wodurch schrittweise verbesserte Regler und/oder Beobachter synthetisiert werden können. Dieser Lernalgorithmus garantiert, dass die Ambiguitätsmenge zu einem Punkt (auch als Singleton bezeichnet) schrumpft, der nur die wahre Verteilung enthält, wenn der Stichprobenumfang gegen unendlich geht. In der Praxis genügt es hier, wenn hinreichend viele Stichproben genommen worden sind.The main problem in designing stochastic controllers in practice is the need to know the true statistics and/or probability distributions of time delays at the time of the control system design. However, these are almost never available in reality and require approximations, e.g., in the form of an empirical distribution, which unfortunately is subject to sampling-induced errors resulting from the sample mean approximation. To synthesize guaranteed stabilizing controllers despite these sampling errors, the invention employs a distributionally robust approach. Specifically, an ambiguity set—that is, a set of uncertainty in the space of probability distributions—is constructed at each point in time around an empirical estimate that contains the true probability distribution with high confidence. This ensures that the resulting controller and/or observer—that is, the indeterminate time-delayed control system—is robust against an entire family of probability distributions at any given time. In a closed-loop control system, data (especially actual time delays, i.e., time delay data) are continuously collected by the control system. The empirical distribution and the ambiguity set are then continuously adapted from this data, resulting in progressively improved controllers and/or observations. These can be synthesized. This learning algorithm guarantees that the ambiguity set shrinks to a point (also called a singleton) containing only the true distribution as the sample size approaches infinity. In practice, it suffices to have taken a sufficiently large number of samples.
Die im Verfahren nach dem ersten allgemeinen Aspekt (oder einer Ausführungsform davon) vorgeschlagene Regelungsstrategie nutzt einen allgemeinen Modellierungsrahmen für NCS - als Markov Jump Linear System (MJLS) bezeichnet - und kombiniert sie mit einem lernbasierten, verteilungsrobusten Regler- und/oder Beobachterentwurf. Im Vergleich zu konventionellen Verfahren können Zeitverzögerungsdaten, d.h. in Form von Messungen, dazu verwendet werden, um je diskreten Zeitschritt eine Markov-Übergangsmatrix sowie eine Ambiguitätsmenge zu konstruieren, die die wahre Wahrscheinlichkeitsverteilung mit einem benutzerdefinierten Konfidenzlevel enthält. Durch kontinuierliches Sammeln weiterer Zeitverzögerungsdaten können die Markov-Übergangsmatrix rekursiv aktualisiert und die Ambiguitätsmenge reduziert werden, während das gleiche benutzerdefinierte Konfidenzlevel beibehalten wird. Diese Adaption der Markov-Übergangsmatrix und der Ambiguitätsmenge stellt einen lernbasierten Regler- und/oder Beobachterentwurf dar. Dadurch wird erreicht, dass eine zu konservative Auslegung der Regelung durch sukzessive Verkleinerung der Ambiguitätsmenge reduziert wird und dennoch die probabilistischen Stabilitätsgarantien (aufgrund des Konfidenzlevels) aufrechterhalten werden.The control strategy proposed in the procedure according to the first general aspect (or an embodiment thereof) utilizes a general modeling framework for NCS—referred to as the Markov Jump Linear System (MJLS)—and combines it with a learning-based, distributionally robust controller and/or observer design. In contrast to conventional methods, time-delay data, i.e., in the form of measurements, can be used to construct, for each discrete time step, a Markov transition matrix and an ambiguity set containing the true probability distribution with a user-defined confidence level. By continuously collecting further time-delay data, the Markov transition matrix can be recursively updated and the ambiguity set reduced while maintaining the same user-defined confidence level. This adaptation of the Markov transition matrix and the ambiguity set represents a learning-based controller and/or observer design. This ensures that an overly conservative control design is reduced by successively decreasing the ambiguity set, while still maintaining probabilistic stability guarantees (due to the confidence level).
Darüber hinaus kann zwischen dem Regelkreis selbst, der durch ein Netzwerk geschlossen wird, und dem Lernalgorithmus, unterschieden werden. Letzterer kann als Mikrodienst verstanden werden, der sich in einem anderen Netzwerk (z. B. in einer Cloud) befinden kann, mit Best-Effort-Anforderungen an die Verfügbarkeit und Zuverlässigkeit.Furthermore, a distinction can be made between the control loop itself, which is closed by a network, and the learning algorithm. The latter can be understood as a microservice that may reside in a different network (e.g., in a cloud), with best-effort requirements for availability and reliability.
Eine beispielhafte Ausführungsform des in dieser Offenbarung vorgeschlagenen Verfahrens kann folgendermaßen zusammengefasst werden:
- Ein Regelsystem wird mit einem (zunächst) willkürlich stabilisierenden lokalen Regler betrieben, um Zeitverzögerungsdaten zu erzeugen. Dabei handelt es sich um einen zeitkritischen Signalweg, der über ein Netzwerk geschlossen wird. Der lokale Regler überträgt die Zeitstempel kontinuierlich in den lernenden Algorithmus, der sich z.B. in einer Cloud mit nicht zeitkritischer Verarbeitungszeit befindet. Anschließend können die Zeitstempel in eine Menge von ganzzahligen Zeitverzögerungen umgewandelt werden, die bei jedem Eintreffen eines neuen Zeitstempels aktualisiert wird. Die Markov-Übergangsmatrix und die Ambiguitätsmenge können dann zum Beispiel auf der Grundlage der neuen ganzzahligen Zeitverzögerungsinformationen aktualisiert werden. Schließlich wird der Regler auf der Grundlage der neuen Markov-Übergangsmatrix und der Ambiguitätsmenge aktualisiert und wieder in das Regelsystem eingespeist. Nach der Aktualisierung ist die Regelungsleistung gleich oder besser als die des vorherigen lokalen Reglers.
- A control system is operated with a (initially) arbitrarily stabilizing local controller to generate time delay data. This involves a time-critical signal path closed over a network. The local controller continuously transmits the timestamps to the learning algorithm, which resides, for example, in a cloud with non-time-critical processing time. The timestamps can then be converted into a set of integer time delays, which is updated with each new timestamp. The Markov transition matrix and the ambiguity set can then be updated, for example, based on the new integer time delay information. Finally, the controller is updated based on the new Markov transition matrix and the ambiguity set and fed back into the control system. After the update, the control performance is equal to or better than that of the previous local controller.
Kurzbeschreibung der FigurenBrief description of the characters
-
1 illustriert ein beispielhaftes unbestimmt zeitverzögertes System umfassend drei Fahrzeuge, die Platooning und insbesondere einen Gruppenstart ausführen.1 illustrates an exemplary, indefinitely time-delayed system comprising three vehicles performing platooning and, in particular, a group start. -
2 illustriert schematisch beispielhafte Ausführungsformen eines computerimplementierten Verfahrens für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt zeitverzögerten Systems.2 schematically illustrates exemplary embodiments of a computer-implemented method for robust adaptive control and/or a robust adaptive observer of an indeterminate time-delayed system. -
3 illustriert eine beispielhafte Ausführungsform eines Gesamtsystem umfassend ein unbestimmt zeitverzögertes System und eine Recheneinheit, die dafür ausgelegt ist, das computer-implementierte Verfahren für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt zeitverzögerten Systems auszuführen.3 illustrates an exemplary embodiment of a complete system comprising an indefinitely time-delayed system and a computing unit designed to execute the computer-implemented method for robust adaptive control and/or a robust adaptive observer of an indefinitely time-delayed system. -
4a illustriert beispielhafte Vektoren für den Zustand, den messbaren Ausgang und den Input eines Reglers.4a illustrates exemplary vectors for the state, the measurable output and the input of a controller. -
4b illustriert eine beispielhafte Markov-Übergangsmatrix mit Übergangswahrscheinlichkeiten für Übergänge zwischen Verzögerungen.4b illustrates an exemplary Markov transition matrix with transition probabilities for transitions between delays. -
4c illustriert ein beispielhaftes Markov Jump Linear System mit erweitertem Zustand ξ für das unbestimmt zeitverzögerte System.4c illustrates an exemplary Markov Jump Linear System with extended state ξ for the indefinitely time-delayed system. -
4d illustriert eine beispielhafte Menge von ganzzahligen Verzögerungen, die für das für das unbestimmt zeitverzögerte System (sukzessiv) ermittelt werden.4d illustrates an exemplary set of integer delays that are determined (successively) for the indefinitely time-delayed system. -
5 illustriert beispielhafte sukzessive Übergangswahrscheinlichkeiten Pi: = (Pi1,Pi2,Pi3) und dazugehörige kleine werdende Ambiguitätsmengen.5 illustrates exemplary successive transition probabilities P i: = (P i1 ,P i2 ,P i3 ) and corresponding small decreasing ambiguity sets. -
6a illustriert beispielhafte Regelungsvorgänge für ein zweites Fahrzeug beim Platooning-Gruppenstart zu drei unterschiedlichen Zeitpunkten im Verfahren sowie dazugehörige 3σ-Konfidenzintervalle.6a illustrates exemplary control processes for a second vehicle during the platooning group start at three different times in the procedure, as well as the corresponding 3σ confidence intervals. -
6b illustriert beispielhafte Regelungsvorgänge für ein drittes Fahrzeug beim Platooning-Gruppenstart zu drei unterschiedlichen Zeitpunkten im Verfahren sowie dazugehörige 3σ-Konfidenzintervalle.6b illustrates exemplary control processes for a third vehicle during a platooning group start to three different Time points in the procedure and their corresponding 3σ confidence intervals.
Detaillierte BeschreibungDetailed description
Offenbart wird zunächst ein computer-implementiertes Verfahren 100 für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt (d.h. stochastisch) zeitverzögerten Systems 40. Das unbestimmt zeitverzögerte System 40 kann einen Regler 10 (auch als lokaler Regler bezeichnet) und ein zu regelndes technisches System 20 umfassen. Optional kann das unbestimmt zeitverzögerte System 40 auch einen Beobachter 11 (auch als lokaler Beobachter bezeichnet) umfassen. Der Regler 10 und/oder der Beobachter 11 können zumindest teilweise über ein Kommunikationsnetzwerk 30 mit dem zu regelnden technischen System 20 kommunizieren.First, a computer-implemented method 100 for robust adaptive control and/or a robust adaptive observer of an indeterminately (i.e., stochastically) time-delayed system 40 is disclosed. The indeterminately time-delayed system 40 can comprise a controller 10 (also referred to as a local controller) and a controlled technical system 20. Optionally, the indeterminately time-delayed system 40 can also include an observer 11 (also referred to as a local observer). The controller 10 and/or the observer 11 can communicate, at least partially, with the controlled technical system 20 via a communication network 30.
Das in dieser Offenbarung vorgeschlagene Verfahren 100 kann also auf eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt (d.h. stochastisch) zeitverzögerten Systems gerichtet sein.The method 100 proposed in this disclosure can therefore be directed to a robust adaptive control and/or a robust adaptive observer of an indeterminate (i.e. stochastically) time-delayed system.
Wie beispielhaft in
Wie z.B. in
Wie ebenfalls z.B. in
Wie ebenfalls z.B. in
Das unbestimmt zeitverzögerte System 40 kann zunächst als lineares zeitkontinuierliches System mit unbestimmter Zeitverzögerung τ ∈ ℝ≥0 und bekannter Abtastzeit h ∈ ℝ>0 modelliert werden, z.B. durch folgende Gleichungen:
Hierbei ist x ein Zustandsvektor, y ein messbarer Ausgangsvektor und u ein Eingangsvektor. Durch Diskretisieren der Zeit, z.B. nach Euler Integration, lassen sich die ersten beiden Gleichungen wie folgt ausdrücken:
Hier wurde die kontinuierliche Zeitverzögerung τ in eine zeitdiskrete Markov-Kette θ(k) ∈ {0,...,M} übersetzt. Hier stellt also jeder Markov-Zustand (auch: Markov-Mode) i ∈ {0,...,M} eine ganzzahlige Zeitverzögerung Δtk = i h dar, wobei M E ℕ die maximale Zeitverzögerung bezeichnet, die je Anwendungsfall von Interesse ist.Here, the continuous time delay τ was translated into a discrete-time Markov chain θ(k) ∈ {0,...,M}. Thus, each Markov state (also: Markov mode) i ∈ {0,...,M} represents an integer time delay Δt k = ih, where ME ℕ denotes the maximum time delay of interest in each application.
Das Gleichungssystem kann wie in
Zeitpunkte und/oder mögliche Zeitverzögerungen können also diskret sein. Die einen oder mehreren Übergangswahrscheinlichkeiten für Übergänge von Zeitverzögerungen zum ersten Zeitpunkt zu Zeitverzögerungen zum zweiten Zeitpunkt in einer Markov-Übergangsmatrix (siehe z.B.
Das Empfangen 110, insbesondere via die erste Kommunikationsschnittstelle, der für den ersten Zeitpunkt für das unbestimmt zeitverzögerte System 40 ermittelten, insbesondere gemessenen, Zeitverzögerung und einer für einen zweiten Zeitpunkt für das unbestimmt zeitverzögerte System 40 ermittelten, insbesondere gemessenen, Zeitverzögerung kann Empfangen, insbesondere via die erste Kommunikationsschnittstelle, einer Information, aus der eine Zeitverzögerung für einen ersten Zeitpunkt für das unbestimmt zeitverzögerte System 40 ermittelt werden kann, und einer Information, aus der eine Zeitverzögerung für einen zweiten Zeitpunkt für das unbestimmt zeitverzögerte System 40 ermittelt werden kann, umfassen. Wie z.B. in
Der erste Zeitpunkt kann zum Beispiel tk = k h sein, wobei h eine Abtastzeit ist und k ∈ ℕ0 Null oder eine positive Ganzzahl ist. Dieser Zeitpunkt kann mit der Ganzzahl k identifiziert werden, d.h. man kann zum Beispiel vom k-ten Zeitpunkt sprechen. Der zweite Zeitpunkt kann zum Beispiel der unmittelbar auf den ersten Zeitpunkt folgende Zeitpunkt tk+1 = (k + 1) h = tk + h sein. Dieser Zeitpunkt kann wiederum mit der Ganzzahl k + 1 identifiziert werden.The first time point can be, for example, t <sub>k</sub> = kh, where h is a sampling time and k ∈ ℕ<sub> 0 </sub> is zero or a positive integer. This time point can be identified with the integer k; that is, one can speak, for example, of the k-th time point. The second time point can be, for example, the time point immediately following the first time point, t<sub> k+1 </sub> = (k + 1)<sub>h</sub> = t<sub> k +h</sub>. This time point can again be identified with the integer k + 1.
Die für den ersten Zeitpunkt für das unbestimmt zeitverzögerte System 40 ermittelte Zeitverzögerung und die für den zweiten Zeitpunkt für das unbestimmt zeitverzögerte System 40 ermittelte Zeitverzögerung können bereits diskret empfangen 110 werden oder nach dem Empfangen 110 diskretisiert werden (sodass sie ebenfalls diskret werden). Die diskreten Zeitverzögerungen können zum Beispiel in Vielfachen der Abtastzeit h ausgedrückt werden. Zum Beispiel können die folgenden diskreten Zeitverzögerungen Δtk = i h für alle i ∈ {0,...,M} betrachtet werden, wobei M eine vorbestimmte positive Ganzzahl ist. Solche diskrete Zeitverzögerungen können als (diskrete) Markov-Zustände gesehen werden, wobei diese mit den Ganzzahlen i ∈ {0,...,M} identifiziert werden können. Diskrete Zeitverzögerungen können zum Beispiel durch die Formel in
Das Bestimmen 120 von einen oder mehreren Übergangswahrscheinlichkeiten für Übergänge von Zeitverzögerungen zum ersten Zeitpunkt zu Zeitverzögerungen zum zweiten Zeitpunkt kann ein Bestimmen von einen oder mehreren Übergangswahrscheinlichkeiten für Übergänge von diskreten Zeitverzögerungen zum ersten Zeitpunkt zu diskreten Zeitverzögerungen zum zweiten Zeitpunkt sein. Zum Beispiel können hier Übergangswahrscheinlichkeiten pij = P(θ(k + 1) = j | θ(k) = i) für Übergänge von einem Markov-Zustand i zu einem (im Allgemeinen anderen) Markov-Zustand j für i,j E {0,...,M} bestimmt werden. Solche Übergangswahrscheinlichkeiten können Komponenten in der Markov-Übergangsmatrix sein. Durch den Schritt 120 und Wiederholen des Verfahrens 100 - d.h. durch weitere Schritte 120 für die nächsten Zeitpunkte - werden die einen oder mehreren Übergangswahrscheinlichkeiten, insbesondere z.B. die Markov-Übergangsmatrix anhand der ermittelten und/oder gemessenen Zeitverzögerungen des unbestimmt zeitverzögerten Systems 40 empirisch geschätzt. Ein Schätzwert für die Übergangswahrscheinlichkeit pij wird nachfolgend als P̂ij bezeichnet.Determining one or more transition probabilities for transitions from time delays at the first time to time delays at the second time can be determined as a process for determining one or more transition probabilities for transitions from discrete time delays at the first time to discrete time delays at the second time. For example, transition probabilities p <sub>ij</sub> = P(θ(k + 1) = j | θ(k) = i) for transitions from a Markov state i to a (generally different) Markov state j for i,j ∈ {0,...,M} can be determined. Such transition probabilities can be components in the Markov transition matrix. By step 120 and repeating procedure 100—that is, by further steps 120 for At the next time points, one or more transition probabilities, in particular, for example, the Markov transition matrix, are empirically estimated based on the determined and/or measured time delays of the indeterminately time-delayed system 40. An estimate for the transition probability p<sub> ij </sub> is subsequently referred to as P̂<sub>ij</sub> .
Eine Ambiguitätsmenge kann eine Menge von Übergangswahrscheinlichkeiten sein, wobei die im Verfahren 100 bestimmte 120 Übergangswahrscheinlichkeit (per Konstruktion) in dieser Menge enthalten ist. Zum Beispiel können Übergangswahrscheinlichkeiten für jeweils einen Übergang von einem festen Markov-Zustand i für i ∈ {0,...,M} zu allen möglichen Markov-Zuständen j für j ∈ {0,...,M} bestimmt werden. Im Allgemeinen (für M > 0) bilden diese bestimmten 120 Übergangswahrscheinlichkeiten einen Punkt in einem höher-dimensionalen Raum. In
Das Bestimmen 120 der einen oder mehreren Übergangswahrscheinlichkeiten kann insbesondere Bestimmen einer oder mehrerer Übergangswahrscheinlichkeiten für jeweils einen Übergang von der für den ersten Zeitpunkt ermittelten Zeitverzögerung zu einer möglichen Zeitverzögerung an dem zweiten Zeitpunkt umfassen.Determining 120 of the one or more transition probabilities may in particular include determining one or more transition probabilities for each transition from the time delay determined for the first time point to a possible time delay at the second time point.
Das Bestimmen 130 der einen oder mehreren Ambiguitätsmengen um die einen oder mehreren bestimmten 120 Übergangswahrscheinlichkeiten kann Bestimmen einer Ambiguitätsmenge um die eine oder mehreren Übergangswahrscheinlichkeiten für jeweils einen Übergang von der für den ersten Zeitpunkt ermittelten Zeitverzögerung zu einer möglichen Zeitverzögerung an dem zweiten Zeitpunkt umfassen.Determining 130 of the one or more ambiguity sets around the one or more determined 120 transition probabilities can include determining an ambiguity set around the one or more transition probabilities for each transition from the time delay determined for the first time point to a possible time delay at the second time point.
Das Bestimmen 120 der einen oder mehreren Übergangswahrscheinlichkeiten kann Bestimmen einer Übergangswahrscheinlichkeit für einen Übergang von der für den ersten Zeitpunkt ermittelten Zeitverzögerung zu der für den zweiten Zeitpunkt ermittelten Zeitverzögerung umfassen.Determining 120 of one or more transition probabilities may include determining a transition probability for a transition from the time delay determined for the first time point to the time delay determined for the second time point.
Das Bestimmen 120 der einen oder mehreren Übergangswahrscheinlichkeiten kann die folgenden Schritte umfassen oder diesen entsprechen, wenn die Übergänge von der für den ersten Zeitpunkt im unbestimmt zeitverzögerten System 40 ermittelten Zeitverzögerung ausgehen:
- - Invertieren einer Gesamtanzahl der für den ersten Zeitpunkt im unbestimmt zeitverzögerten System 40 ermittelten Zeitverzögerung, wobei eine inverse Samplegröße resultiert;
- - Skalieren einer oder mehrerer Übergangswahrscheinlichkeiten für Übergänge von Zeitverzögerungen zu einem früheren als den ersten Zeitpunkt zu Zeitverzögerungen zum ersten Zeitpunkt mit einem Skalierungsfaktor, wobei der Skalierungsfaktor Eins minus der inversen Samplegröße ist, wobei ein oder mehrere erste Übergangswahrscheinlichkeiten resultieren;
- - Skalieren der Übergangswahrscheinlichkeit für einen Übergang von der für den ersten Zeitpunkt ermittelten Zeitverzögerung zu der für den zweiten Zeitpunkt ermittelten Zeitverzögerung mit der inversen Samplegröße, wobei eine zweite Übergangswahrscheinlichkeit resultiert;
- - optional, Addieren der ein oder mehreren ersten Übergangswahrscheinlichkeiten und der zweiten Übergangswahrscheinlichkeit.
- - Inverting a total number of the time delays determined for the first time point in the indefinitely time-delayed system 40, resulting in an inverse sample size;
- - Scaling one or more transition probabilities for transitions from time delays to an earlier time than the first time to time delays to the first time by a scaling factor, where the scaling factor is one minus the inverse sample size, resulting in one or more first transition probabilities;
- - Scaling the transition probability for a transition from the time delay determined for the first time point to the time delay determined for the second time point using the inverse sample size, resulting in a second transition probability;
- - optional, adding the one or more first transition probabilities and the second transition probability.
Die Gesamtanzahl der für den ersten Zeitpunkt k (d.h. tk = k h) im unbestimmt zeitverzögerten System 40 ermittelten Zeitverzögerung Δk = i (d.h. Δtk = i h) kann als γi -1(k) ∈ ℕ bezeichnet werden, die inverse Samplegröße sodann als γi(k). Die Gesamtanzahl der für den ersten Zeitpunkt k (d.h. tk = k h) im unbestimmt zeitverzögerten System 40 ermittelten Zeitverzögerung wird um eins inkrementiert, wenn die für den zweiten Zeitpunkt k + 1 (d.h. tk+1 = (k + 1) h) im unbestimmt zeitverzögerten System 40 ermittelte Zeitverzögerung ebenfalls Δk+1 = i (d.h. Δtk+1 = i h) ist, wobei die Gesamtanzahl γi -1(k+1) der für den zweiten Zeitpunkt im unbestimmt zeitverzögerten System 40 ermittelten Zeitverzögerung resultiert. Die inverse Samplegröße kann also in diesem Fall rekursiv wie folgt ermittelt werden,
Das Bestimmen 120 der einen oder mehreren Übergangswahrscheinlichkeiten kann andererseits den folgenden Schritt umfassen oder diesem entsprechen, wenn die Übergänge nicht von der für den ersten Zeitpunkt im unbestimmt zeitverzögerten System 40 ermittelten Zeitverzögerung ausgehen:
- - Beibehalten einer oder mehrerer Übergangswahrscheinlichkeiten für Übergänge von Zeitverzögerungen zu dem früheren als den ersten Zeitpunkt zu Zeitverzögerungen zum ersten Zeitpunkt.
- - Maintaining one or more transition probabilities for transitions from time delays to the earlier than the first time to time delays to the first time.
Da zu jedem Zeitpunkt entweder Δk = i oder Δk # i gilt, kommt zu jedem Zeitpunkt für ein i entweder Gleichung 1 oder Gleichung 2 zur Anwendung. Dies kann für alle Markov-Zustände i durchgeführt werden. In diesem Fall kann genau eine Zeile der Markov-Übergangsmatrix in nicht-trivialer Weise (d.h. gemäß Gleichung 1) angepasst werden, während die anderen Zeilen der Markov-Übergangsmatrix beibehalten, d.h. nicht angepasst oder in trivialer Weise (d.h. gemäß Gleichung 2) angepasst, werden.Since at any given time either Δk = i or Δk ≤ i, at any given time either Equation 1 or Equation 2 applies to some i. This can be done for all Markov states i. In this case, exactly one row of the Markov transition matrix can be fitted in a non-trivial way (i.e., according to Equation 1), while the other rows of the Markov transition matrix are either left unfitted or fitted in a trivial way (i.e., according to Equation 2).
Das Bestimmen 120 der einen oder mehreren Übergangswahrscheinlichkeiten kann somit rekursiv erfolgen und zudem auf einen oder mehreren initialen Übergangswahrscheinlichkeiten P̂i:(0) für alle Markov-Zustände i für Übergänge von Zeitverzögerungen zu einem initialen Zeitpunkt t0 = 0 h = 0 in einem Betrieb des zeitverzögerten Systems zu Zeitverzögerungen zum auf den initialen Zeitpunkt unmittelbar folgenden Zeitpunkt t1 = 1 h = h basieren. Die eine oder mehreren initialen Übergangswahrscheinlichkeiten P̂i:(0) für alle Markov-Zustände i können teilweise null sein. Sie können zum Beispiel der in
Mindestens eine Übergangswahrscheinlichkeit für jeweils einen Übergang von einer Zeitverzögerung zu einer anderen Zeitverzögerung zu einem initialen Zeitpunkt im Betrieb des zeitverzögerten Systems 40 oder für alle Zeitpunkte kann null sein. Die Übergangswahrscheinlichkeiten P̂i:(k) für Übergänge von dem Markov-Zustand i müssen zu jedem Zeitpunkt k auf eins normiert sein, d.h. es gilt,
Die Übergangswahrscheinlichkeiten für jeweils einen Übergang von einer Zeitverzögerung zum initialen Zeitpunkt t0 = 0 h = 0 zu einer möglichen Zeitverzögerung an dem auf den initialen Zeitpunkt unmittelbar folgenden Zeitpunkt t1 = 1h = h können gleichverteilt sind. Zum Beispiel kann p00 = 1/2,p01 = 1/2, p10 = 1/3,p11 = 1/3, p12 = 1/3, etc. gelten.The transition probabilities for each transition from a time delay at the initial time t <sub>0 </sub> = 0 h = 0 to a possible time delay at the time immediately following the initial time t <sub>1 </sub> = 1 h = h can be uniformly distributed. For example, p <sub> 00</sub> = 1/2, p<sub> 01 </sub> = 1/2, p<sub> 10 </sub> = 1/3, p<sub>11</sub> = 1/3, p<sub> 12 </sub> = 1/3, etc. , can hold.
Auch das Bestimmen 130 der einen oder mehreren Ambiguitätsmengen um die einen oder mehreren bestimmten 120 Übergangswahrscheinlichkeiten kann rekursiv erfolgen und zudem auf den einen oder mehreren initialen Übergangswahrscheinlichkeiten für Übergänge von Zeitverzögerungen zu einem initialen Zeitpunkt in einem Betrieb des zeitverzögerten Systems zu Zeitverzögerungen zum auf den initialen Zeitpunkt unmittelbar folgenden Zeitpunkt basieren.Determining 130 of the one or more ambiguity sets around the one or more determined 120 transition probabilities can also be done recursively and can also be based on the one or more initial transition probabilities for transitions from time delays at an initial time point in an operation of the time-delayed system to time delays at the time point immediately following the initial time point.
Die einen oder mehreren Übergangswahrscheinlichkeiten P̂ij(k) für jeweils einen Übergang von der für den ersten Zeitpunkt k (d.h. tk = k h) ermittelten Zeitverzögerung Δk = i (d.h. Δtk = i h) zu einer möglichen Zeitverzögerung an dem zweiten Zeitpunkt k + 1 (d.h. tk+1 = (k + 1) h) können ein Punkt in einem endlich-dimensionalen Vektorraum sein. Die Ambiguitätsmenge für diese Übergangswahrscheinlichkeiten kann von einer Kugel um diesen Punkt mit einem Radius in einer endlich-dimensionalen Norm (z.B. p-Norm mit p=1) umfasst werden, wobei der Radius auf einem Konfidenzlevel und/oder einer Gesamtanzahl γi -1(k) (oder deren Inverses, d.h. der inversen Samplegröße γi(k)) der für den ersten Zeitpunkt im unbestimmt zeitverzögerten System 40 ermittelten Zeitverzögerung basieren kann. Der Radius kann bei konstantem Konfidenzlevel und zunehmender Gesamtanzahl der für den ersten Zeitpunkt im unbestimmt zeitverzögerten System ermittelten Zeitverzögerung abnehmen. Zum Beispiel kann der Radius durch eine Konzentrationsungleichung wie z.B. eine McDiarmid-Ungleichung ermittelt werden. Zum Beispiel kann die Ambiguitätsmenge A(P̂i:(k)) wie folgt bestimmt werden,
In
Wie z.B. in
Wie ebenfalls z.B. in
Wie beispielhaft in
Ziel kann sein, einen verteilungsrobusten Regler der Form uk = K ξ̂k zu entwerfen, der das Markov Jump Linear System (MJLS) für alle möglichen Markov-Zustände θ(k) ∈ {0,...,M} auf der Grundlage einer Zustandsschätzung ξ̂k stabilisiert, die sich aus einem verteilungsrobusten Beobachter 11 mit der folgenden Dynamik ergibt,
Sodann kann ein verteilungsrobuster LQR-Entwurfsansatz verwendet werden, um die Reglerverstärkung (englisch: controller gain) K zu synthetisieren, die analog dazu verwendet werden kann, um die verteilungsrobuste Beobachterverstärkung L aufgrund der dualen Beziehung zwischen dem Regelungs- und dem Beobachtungsproblem abzuleiten. Wenn der vollständige Zustandsvektor ξ messbar ist, ist der Beobachter überflüssig und ein Regler der Form uk = K ξk kann stattdessen verwendet werden.A distribution-robust LQR design approach can then be used to synthesize the controller gain K, which can be used analogously to derive the distribution-robust observer gain L due to the dual relationship between the control and observation problems. If the complete state vector ξ is measurable, the observer is superfluous and a controller of the form u <sub>k</sub> = K ξ<sub> k </sub> can be used instead.
Zur Illustration wird hier noch einmal das Beispiel mit dem Gruppenstart von drei Fahrzeugen mit unzuverlässiger Kommunikation über ein Netzwerk aus
Weiterhin sind zum Beispiel folgende Erweiterungen denkbar:
- In einigen Netzregelungssystemen ändert sich die zugrundeliegende Zeitverzögerungsverteilung im Laufe der Zeit aufgrund unterschiedlicher Netzlasten. In diesem Fall kann der vorgeschlagene Regelungsansatz erweitert werden, um diese Trends zu erfassen, indem ein fester, modusabhängiger Stichprobenumfang für das Lernverfahren vorgesehen wird.
- Ein Sonderfall zeitlich veränderlicher Zeitverzögerungsverteilungen ist eine diskrete Umschaltung. In diesem Fall kann eine ereignisgesteuerte Reinitialisierung eingebaut werden, die das vorgeschlagene Lernverfahren zurücksetzt, wenn die neuen Daten nicht in die zuvor gelernte Markov-Übergangsmatrix passen. Eine mögliche Auslösebedingung lässt sich aus dem Gesamtvariationsabstand zwischen zwei Verteilungen ableiten.
- In some grid control systems, the underlying time delay distribution changes over time due to varying grid loads. In this case, the proposed control approach can be extended to capture these trends by providing a fixed, mode-dependent sample size for the learning process.
- A special case of time-varying time-delay distributions is a discrete switching operation. In this case, an event-driven reinitialization can be implemented, which resets the proposed learning algorithm if the new data does not fit into the previously learned Markov transition matrix. A possible trigger condition can be derived from the total variation between two distributions.
Offenbart werden weiterhin ein Regler 10 und/oder ein Beobachter 11, die dafür konfiguriert sein, ein technisches System 20 zu regeln, wobei der Regler 10 und/oder der Beobachter 11 zumindest teilweise über ein Kommunikationsnetzwerk 30 mit dem zu regelnden technischen System 20 kommunizieren. Das Kommunikationsnetzwerk 30 kann zum Beispiel ein Drahtlosnetzwerk umfassen oder sein. Der Regler 10 und/oder der Beobachter 11 umfassen eine zweite Kommunikationsschnittstelle, um Information an eine Recheneinheit 50, insbesondere an eine Recheneinheit 50 außerhalb eines unbestimmt zeitverzögerten Systems 40 umfassend den Regler 10 und/oder den Beobachter 11, zu senden, aus der eine Zeitverzögerung für einen ersten Zeitpunkt für das unbestimmt zeitverzögerte System 40 und eine Zeitverzögerung für einen zweiten Zeitpunkt für das unbestimmt zeitverzögerte System 40 ermittelt werden können, wobei der zweite Zeitpunkt später als der erste Zeitpunkt ist. Die zweite Kommunikationsschnittstelle kann weiterhin dafür ausgelegt sein, ein Update von der Recheneinheit 50 zu erhalten, wobei das Update einen angepassten 140 Regler und/oder einen angepassten 140 Beobachter umfasst. Der Regler 10 und/oder der Beobachter 11 können dafür ausgelegt sein, das Update (oder die Updates) zu implementieren (d.h. umgangssprachlich, zu installieren).Furthermore, a controller 10 and/or an observer 11 are disclosed, which are configured to control a technical system 20, wherein the controller 10 and/or the observer 11 communicate with the technical system 20 to be controlled at least partially via a communication network 30. The communication network 30 can, for example, comprise or be a wireless network. The controller 10 and/or the observer 11 comprise a second communication interface for sending information to a computing unit 50, in particular to a computing unit 50 outside of an indefinitely time-delayed system 40 comprising the controller 10 and/or the observer 11, from which a time delay for a first time point for the indefinitely time-delayed system 40 and a time delay for a second time point for the indefinitely time-delayed system 40 can be determined, the second time point being later than the first time point. The second communication interface can still be configured to receive an update from the computing unit 50, the update comprising a customized controller 140 and/or a customized observer 140. The controller 10 and/or the observer 11 can be configured to implement (i.e., install) the update (or updates).
Offenbart wird weiterhin ein unbestimmt zeitverzögertes System 40 umfassend den Regler 10 und/oder den Beobachter 11, ein zu regelndes technische System 20 und ein Kommunikationsnetzwerk 30. Der Regler 10 und/oder der Beobachter 11 können zumindest teilweise über das Kommunikationsnetzwerk 30 mit dem zu regelnden technischen System 20 kommunizieren.Furthermore, an indefinitely time-delayed system 40 comprising the controller 10 and/or the observer 11, a technical system 20 to be controlled, and a communication network 30 is disclosed. The controller 10 and/or the observer 11 can be controlled at least partially via the communication network 30. network 30 communicates with the technical system 20 to be controlled.
Offenbart wird weiterhin eine Recheneinheit 50 (mithin ein Computer-System), die dafür ausgelegt ist, das computer-implementierte Verfahren 100 für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt (d.h. stochastisch) zeitverzögerten Systems 40 auszuführen. Die Recheneinheit 50 umfasst eine erste Kommunikationsschnittstelle. Die Recheneinheit 50 kann weiterhin einen Prozessor und/oder einen Arbeitsspeicher umfassen.Furthermore, a computing unit 50 (i.e., a computer system) is disclosed, which is designed to execute the computer-implemented method 100 for robust adaptive control and/or a robust adaptive observer of an indeterminately (i.e., stochastically) time-delayed system 40. The computing unit 50 includes a first communication interface. The computing unit 50 may further include a processor and/or main memory.
Offenbart wird weiterhin ein Gesamtsystem 60, umfassend das unbestimmt zeitverzögerte System 40 und die Recheneinheit 50. Ein beispielhaftes Gesamtsystem ist in
Offenbart wird weiterhin ein Computer-Programm, das dafür ausgelegt ist, das computer-implementierte Verfahren 100 für eine robuste adaptive Regelung und/oder einen robusten adaptiven Beobachter eines unbestimmt (d.h. stochastisch) zeitverzögerten Systems auszuführen. Das Computer-Programm kann z.B. in interpretierbarer oder in kompilierter Form vorliegen. Es kann (auch in Teilen) zur Ausführung z.B. als Bit- oder Byte-Folge in den RAM eines Computers geladen werden.Furthermore, a computer program is disclosed that is designed to execute the computer-implemented method 100 for robust adaptive control and/or a robust adaptive observer of an indeterminately (i.e., stochastically) time-delayed system. The computer program can be in interpretable or compiled form, for example. It can be loaded (even partially) into a computer's RAM for execution, for example, as a bit or byte sequence.
Offenbart wird weiterhin ein computer-lesbares Medium oder Signal, das das Computer-Programm speichert und/oder enthält. Das Medium kann z.B. eines von RAM, ROM, EPROM, HDD, SSD, ... umfassen, auf/in dem das Signal gespeichert wird.Furthermore, a computer-readable medium or signal that stores and/or contains the computer program is disclosed. The medium can include, for example, RAM, ROM, EPROM, HDD, SSD, etc., on/in which the signal is stored.
Claims (15)
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024204002.9A DE102024204002A1 (en) | 2024-04-29 | 2024-04-29 | ROBUST ADAPTIVE CONTROL FOR INDEFINITE TIME-DELAYED CONTROL SYSTEMS |
| JP2025073149A JP2025181677A (en) | 2024-04-29 | 2025-04-25 | Robust adaptive control functions for uncertain time-delay control systems. |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE102024204002.9A DE102024204002A1 (en) | 2024-04-29 | 2024-04-29 | ROBUST ADAPTIVE CONTROL FOR INDEFINITE TIME-DELAYED CONTROL SYSTEMS |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| DE102024204002A1 true DE102024204002A1 (en) | 2025-10-30 |
Family
ID=97303803
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE102024204002.9A Pending DE102024204002A1 (en) | 2024-04-29 | 2024-04-29 | ROBUST ADAPTIVE CONTROL FOR INDEFINITE TIME-DELAYED CONTROL SYSTEMS |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP2025181677A (en) |
| DE (1) | DE102024204002A1 (en) |
-
2024
- 2024-04-29 DE DE102024204002.9A patent/DE102024204002A1/en active Pending
-
2025
- 2025-04-25 JP JP2025073149A patent/JP2025181677A/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| JP2025181677A (en) | 2025-12-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE102018202654B4 (en) | Machine learning apparatus, servo control device, servo control system and machine learning method | |
| DE102008020380B4 (en) | Method for computer-aided learning of a control and / or regulation of a technical system | |
| EP2185980A1 (en) | Method for computer-aided control and/or regulation using neural networks | |
| DE102007001025A1 (en) | Method for computer aided control and regulation of technical system, involves carrying out characterization of dynamic behavior of technical systems multiple times by state and action of system | |
| DE102008020379A1 (en) | Method for computer-aided control and / or regulation of a technical system | |
| DE102007001026B4 (en) | Method for computer-aided control and / or regulation of a technical system | |
| EP3188053A1 (en) | Method for configuring a co-simulation for an overall system | |
| WO2021259980A1 (en) | Training an artificial neural network, artificial neural network, use, computer program, storage medium, and device | |
| EP2128726B1 (en) | Method and simulator for real-time calculation of the state variables of a process model | |
| EP3785178B1 (en) | Method and device for determining a network-configuration of a neural network | |
| DE102024204002A1 (en) | ROBUST ADAPTIVE CONTROL FOR INDEFINITE TIME-DELAYED CONTROL SYSTEMS | |
| DE102024205873B3 (en) | ROBUST ADAPTIVE CONTROL FOR INDEFINITELY TIME-DELAYED CONTROL SYSTEMS WITH TIME-VARIABLE DISTRIBUTION FUNCTION | |
| WO2023237316A1 (en) | Method for performing data processing tasks | |
| DE102020210795A1 (en) | Artificial Neural Network | |
| EP3396919A1 (en) | Method for transferring data from one device to a data processing means, transmission unit, device and system | |
| EP4232905A1 (en) | Data processing network for performing data processing | |
| WO2021254672A1 (en) | Method, device, computer program, and computer-readable storage medium for determining a neural network and for operating a vehicle | |
| DE102024205236A1 (en) | COMPUTER-IMPLEMENTED METHOD FOR CONTROLLING A DYNAMIC SYSTEM | |
| DE102024203386A1 (en) | Method for controlling a dynamic system with jitter effects | |
| DE102019132451A1 (en) | Method and device for training a controller with a variable control target | |
| EP3575976A1 (en) | Method for determining a physical connection topology of a real-time-capable test device gene set up for control apparatus development | |
| EP4425385A1 (en) | Supervised machine learning of a computer-implemented method for performing a technical process | |
| EP4425390A1 (en) | Supervised machine learning of a computer-implemented method for performing a technical process | |
| EP4563440A1 (en) | Supervised machine learning of a computer-implemented method for performing a technical process | |
| DE102024200893A1 (en) | Method for controlling a distributed system with at least one sensor, one control unit and one actuator |