A study of well-posedness in inverse optimal control
Abstract
En esta tesis de maestría, se aborda el problema de identificar los
parámetros de ponderación en las funciones de coste definidas por un
problema de control óptimo. Debido a la naturaleza del problema,
abordado como un problema inverso, el enfoque de este trabajo es
asegurar el buen planteamiento de los problemas de control óptimo
inverso, un aspecto crucial que garantiza la viabilidad, unicidad y
estabilidad de las funciones de coste estimadas. El estudio emplea la
metodología del regulador cuadrático lineal (LQR) dentro de un sistema
lineal.
Un aspecto central de esta investigación es la determinación de los
parámetros Q y R en el enfoque LQR, que desempeñan un papel
fundamental en la definición de la eficiencia y la eficacia del sistema de
control. La tesis examina cómo pueden elegirse óptimamente estos
parámetros y el impacto que tienen en el rendimiento del sistema. Además,
el estudio explora el uso de restricciones para mejorar la respuesta
transitoria del sistema, un factor importante en el diseño de sistemas de
control, garantizando que el sistema alcance rápida y eficazmente los
requisitos de diseño deseados.
En este trabajo se propone un enfoque de dos niveles para resolver el
problema de control óptimo inverso. Se trata de utilizar programación
semidefinida para recuperar los parámetros de la función de coste y
evaluar la optimalidad de la solución. Además, se aborda el problema para
encontrar las condiciones para minimizar la función de coste, estimando
los parámetros Q y R a partir de las leyes de control observadas, y
aplicando restricciones para la optimización. Se concluye con resultados
que demuestran la mejora de la respuesta del sistema y un método
alternativo que reduce la dependencia de la matriz de ganancia K. In this master thesis, we address the problem to identify the weighting
parameters in the cost functions defined by an optimal control problem.
Due to the nature of addressed problem as an inverse problem, the focus
of this work is to ensure the well-posedness of inverse optimal control
problems, a crucial aspect that guarantees the feasibility, uniqueness, and
stability of the estimated cost functions. The study employs the Linear
Quadratic Regulator (LQR) methodology within a linear system.
Central to this research is the determination of the parameters Q and R in
the LQR approach, which play a pivotal role in defining the efficiency and
effectiveness of the control system. The thesis examines how these
parameters can be optimally chosen and the impact they have on system
performance. Additionally, the study explores the use of constraints to
enhance the transient response of the system, a significant factor in control
system design, ensuring that the system quickly and effectively reaches its
desired design requirements.
A two-level approach to solving the inverse optimal control problem is
proposed in this work. It involves using semidefinite programming to
recover cost function parameters and evaluating the optimality of the
solution. Also, we address the problem to finding conditions for minimizing
the cost function, estimating parameters Q and R from observed control
laws, and applying constraints for well-posedness. It concludes with results
demonstrating improved system response and an alternative method that
reduces dependence on the K-gain matrix. In dieser Masterarbeit befassen wir uns mit dem Problem der
Identifizierung der Gewichtungsparameter in den Kostenfunktionen, die
durch ein optimales Kontrollproblem definiert werden. Da es sich bei dem
behandelten Problem um ein inverses Problem handelt, liegt der
Schwerpunkt dieser Arbeit auf der Sicherstellung der Wohlgeformtheit von
inversen Optimalsteuerungsproblemen, einem entscheidenden Aspekt,
der die Machbarkeit, Eindeutigkeit und Stabilität der geschätzten
Kostenfunktionen garantiert. In der Studie wird die Methode des linearen
quadratischen Reglers (LQR) in einem linearen System angewandt.
Im Mittelpunkt dieser Untersuchung steht die Bestimmung der Parameter
Q und R im LQR-Ansatz, die eine zentrale Rolle bei der Definition der
Effizienz und Effektivität des Steuerungssystems spielen. In der Arbeit wird
untersucht, wie diese Parameter optimal gewählt werden können und
welchen Einfluss sie auf die Systemleistung haben. Darüber hinaus
untersucht die Studie die Verwendung von Nebenbedingungen zur
Verbesserung des Einschwingverhaltens des Systems, einem wichtigen
Faktor beim Entwurf von Regelsystemen, um sicherzustellen, dass das
System die gewünschten Entwurfsanforderungen schnell und effektiv
erreicht.
In dieser Arbeit wird ein zweistufiger Ansatz zur Lösung des inversen
optimalen Steuerungsproblems vorgeschlagen. Dazu gehört die
Verwendung der semidefiniten Programmierung, um die Parameter der
Kostenfunktion zu ermitteln und die Optimalität der Lösung zu bewerten.
Außerdem befassen wir uns mit dem Problem, Bedingungen für die
Minimierung der Kostenfunktion zu finden, die Parameter Q und R aus den
beobachteten Kontrollgesetzen zu schätzen und Einschränkungen für die
Wohlgeformtheit anzuwenden. Abschließend werden Ergebnisse
vorgestellt, die eine verbesserte Systemantwort und eine alternative
Methode zeigen, die die Abhängigkeit von der K-Gain-Matrix verringert.
Temas
Control automático--Diseño y construcción
Optimización matemática
Sistemas lineales
Optimización matemática
Sistemas lineales
Para optar el título de
Maestro en Ingeniería Mecatrónica
Collections
The following license files are associated with this item: