A study of well-posedness in inverse optimal control
Date
2024-06-04
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Católica del Perú
Abstract
En esta tesis de maestría, se aborda el problema de identificar los
parámetros de ponderación en las funciones de coste definidas por un
problema de control óptimo. Debido a la naturaleza del problema,
abordado como un problema inverso, el enfoque de este trabajo es
asegurar el buen planteamiento de los problemas de control óptimo
inverso, un aspecto crucial que garantiza la viabilidad, unicidad y
estabilidad de las funciones de coste estimadas. El estudio emplea la
metodología del regulador cuadrático lineal (LQR) dentro de un sistema
lineal.
Un aspecto central de esta investigación es la determinación de los
parámetros Q y R en el enfoque LQR, que desempeñan un papel
fundamental en la definición de la eficiencia y la eficacia del sistema de
control. La tesis examina cómo pueden elegirse óptimamente estos
parámetros y el impacto que tienen en el rendimiento del sistema. Además,
el estudio explora el uso de restricciones para mejorar la respuesta
transitoria del sistema, un factor importante en el diseño de sistemas de
control, garantizando que el sistema alcance rápida y eficazmente los
requisitos de diseño deseados.
En este trabajo se propone un enfoque de dos niveles para resolver el
problema de control óptimo inverso. Se trata de utilizar programación
semidefinida para recuperar los parámetros de la función de coste y
evaluar la optimalidad de la solución. Además, se aborda el problema para
encontrar las condiciones para minimizar la función de coste, estimando
los parámetros Q y R a partir de las leyes de control observadas, y
aplicando restricciones para la optimización. Se concluye con resultados
que demuestran la mejora de la respuesta del sistema y un método
alternativo que reduce la dependencia de la matriz de ganancia K.
In this master thesis, we address the problem to identify the weighting parameters in the cost functions defined by an optimal control problem. Due to the nature of addressed problem as an inverse problem, the focus of this work is to ensure the well-posedness of inverse optimal control problems, a crucial aspect that guarantees the feasibility, uniqueness, and stability of the estimated cost functions. The study employs the Linear Quadratic Regulator (LQR) methodology within a linear system. Central to this research is the determination of the parameters Q and R in the LQR approach, which play a pivotal role in defining the efficiency and effectiveness of the control system. The thesis examines how these parameters can be optimally chosen and the impact they have on system performance. Additionally, the study explores the use of constraints to enhance the transient response of the system, a significant factor in control system design, ensuring that the system quickly and effectively reaches its desired design requirements. A two-level approach to solving the inverse optimal control problem is proposed in this work. It involves using semidefinite programming to recover cost function parameters and evaluating the optimality of the solution. Also, we address the problem to finding conditions for minimizing the cost function, estimating parameters Q and R from observed control laws, and applying constraints for well-posedness. It concludes with results demonstrating improved system response and an alternative method that reduces dependence on the K-gain matrix.
In dieser Masterarbeit befassen wir uns mit dem Problem der Identifizierung der Gewichtungsparameter in den Kostenfunktionen, die durch ein optimales Kontrollproblem definiert werden. Da es sich bei dem behandelten Problem um ein inverses Problem handelt, liegt der Schwerpunkt dieser Arbeit auf der Sicherstellung der Wohlgeformtheit von inversen Optimalsteuerungsproblemen, einem entscheidenden Aspekt, der die Machbarkeit, Eindeutigkeit und Stabilität der geschätzten Kostenfunktionen garantiert. In der Studie wird die Methode des linearen quadratischen Reglers (LQR) in einem linearen System angewandt. Im Mittelpunkt dieser Untersuchung steht die Bestimmung der Parameter Q und R im LQR-Ansatz, die eine zentrale Rolle bei der Definition der Effizienz und Effektivität des Steuerungssystems spielen. In der Arbeit wird untersucht, wie diese Parameter optimal gewählt werden können und welchen Einfluss sie auf die Systemleistung haben. Darüber hinaus untersucht die Studie die Verwendung von Nebenbedingungen zur Verbesserung des Einschwingverhaltens des Systems, einem wichtigen Faktor beim Entwurf von Regelsystemen, um sicherzustellen, dass das System die gewünschten Entwurfsanforderungen schnell und effektiv erreicht. In dieser Arbeit wird ein zweistufiger Ansatz zur Lösung des inversen optimalen Steuerungsproblems vorgeschlagen. Dazu gehört die Verwendung der semidefiniten Programmierung, um die Parameter der Kostenfunktion zu ermitteln und die Optimalität der Lösung zu bewerten. Außerdem befassen wir uns mit dem Problem, Bedingungen für die Minimierung der Kostenfunktion zu finden, die Parameter Q und R aus den beobachteten Kontrollgesetzen zu schätzen und Einschränkungen für die Wohlgeformtheit anzuwenden. Abschließend werden Ergebnisse vorgestellt, die eine verbesserte Systemantwort und eine alternative Methode zeigen, die die Abhängigkeit von der K-Gain-Matrix verringert.
In this master thesis, we address the problem to identify the weighting parameters in the cost functions defined by an optimal control problem. Due to the nature of addressed problem as an inverse problem, the focus of this work is to ensure the well-posedness of inverse optimal control problems, a crucial aspect that guarantees the feasibility, uniqueness, and stability of the estimated cost functions. The study employs the Linear Quadratic Regulator (LQR) methodology within a linear system. Central to this research is the determination of the parameters Q and R in the LQR approach, which play a pivotal role in defining the efficiency and effectiveness of the control system. The thesis examines how these parameters can be optimally chosen and the impact they have on system performance. Additionally, the study explores the use of constraints to enhance the transient response of the system, a significant factor in control system design, ensuring that the system quickly and effectively reaches its desired design requirements. A two-level approach to solving the inverse optimal control problem is proposed in this work. It involves using semidefinite programming to recover cost function parameters and evaluating the optimality of the solution. Also, we address the problem to finding conditions for minimizing the cost function, estimating parameters Q and R from observed control laws, and applying constraints for well-posedness. It concludes with results demonstrating improved system response and an alternative method that reduces dependence on the K-gain matrix.
In dieser Masterarbeit befassen wir uns mit dem Problem der Identifizierung der Gewichtungsparameter in den Kostenfunktionen, die durch ein optimales Kontrollproblem definiert werden. Da es sich bei dem behandelten Problem um ein inverses Problem handelt, liegt der Schwerpunkt dieser Arbeit auf der Sicherstellung der Wohlgeformtheit von inversen Optimalsteuerungsproblemen, einem entscheidenden Aspekt, der die Machbarkeit, Eindeutigkeit und Stabilität der geschätzten Kostenfunktionen garantiert. In der Studie wird die Methode des linearen quadratischen Reglers (LQR) in einem linearen System angewandt. Im Mittelpunkt dieser Untersuchung steht die Bestimmung der Parameter Q und R im LQR-Ansatz, die eine zentrale Rolle bei der Definition der Effizienz und Effektivität des Steuerungssystems spielen. In der Arbeit wird untersucht, wie diese Parameter optimal gewählt werden können und welchen Einfluss sie auf die Systemleistung haben. Darüber hinaus untersucht die Studie die Verwendung von Nebenbedingungen zur Verbesserung des Einschwingverhaltens des Systems, einem wichtigen Faktor beim Entwurf von Regelsystemen, um sicherzustellen, dass das System die gewünschten Entwurfsanforderungen schnell und effektiv erreicht. In dieser Arbeit wird ein zweistufiger Ansatz zur Lösung des inversen optimalen Steuerungsproblems vorgeschlagen. Dazu gehört die Verwendung der semidefiniten Programmierung, um die Parameter der Kostenfunktion zu ermitteln und die Optimalität der Lösung zu bewerten. Außerdem befassen wir uns mit dem Problem, Bedingungen für die Minimierung der Kostenfunktion zu finden, die Parameter Q und R aus den beobachteten Kontrollgesetzen zu schätzen und Einschränkungen für die Wohlgeformtheit anzuwenden. Abschließend werden Ergebnisse vorgestellt, die eine verbesserte Systemantwort und eine alternative Methode zeigen, die die Abhängigkeit von der K-Gain-Matrix verringert.
Description
Keywords
Control automático--Diseño y construcción, Optimización matemática, Sistemas lineales
Citation
Collections
Endorsement
Review
Supplemented By
Referenced By
Creative Commons license
Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess