A study of well-posedness in inverse optimal control

Thumbnail Image

Date

2024-06-04

Journal Title

Journal ISSN

Volume Title

Publisher

Pontificia Universidad Católica del Perú

Abstract

En esta tesis de maestría, se aborda el problema de identificar los parámetros de ponderación en las funciones de coste definidas por un problema de control óptimo. Debido a la naturaleza del problema, abordado como un problema inverso, el enfoque de este trabajo es asegurar el buen planteamiento de los problemas de control óptimo inverso, un aspecto crucial que garantiza la viabilidad, unicidad y estabilidad de las funciones de coste estimadas. El estudio emplea la metodología del regulador cuadrático lineal (LQR) dentro de un sistema lineal. Un aspecto central de esta investigación es la determinación de los parámetros Q y R en el enfoque LQR, que desempeñan un papel fundamental en la definición de la eficiencia y la eficacia del sistema de control. La tesis examina cómo pueden elegirse óptimamente estos parámetros y el impacto que tienen en el rendimiento del sistema. Además, el estudio explora el uso de restricciones para mejorar la respuesta transitoria del sistema, un factor importante en el diseño de sistemas de control, garantizando que el sistema alcance rápida y eficazmente los requisitos de diseño deseados. En este trabajo se propone un enfoque de dos niveles para resolver el problema de control óptimo inverso. Se trata de utilizar programación semidefinida para recuperar los parámetros de la función de coste y evaluar la optimalidad de la solución. Además, se aborda el problema para encontrar las condiciones para minimizar la función de coste, estimando los parámetros Q y R a partir de las leyes de control observadas, y aplicando restricciones para la optimización. Se concluye con resultados que demuestran la mejora de la respuesta del sistema y un método alternativo que reduce la dependencia de la matriz de ganancia K.
In this master thesis, we address the problem to identify the weighting parameters in the cost functions defined by an optimal control problem. Due to the nature of addressed problem as an inverse problem, the focus of this work is to ensure the well-posedness of inverse optimal control problems, a crucial aspect that guarantees the feasibility, uniqueness, and stability of the estimated cost functions. The study employs the Linear Quadratic Regulator (LQR) methodology within a linear system. Central to this research is the determination of the parameters Q and R in the LQR approach, which play a pivotal role in defining the efficiency and effectiveness of the control system. The thesis examines how these parameters can be optimally chosen and the impact they have on system performance. Additionally, the study explores the use of constraints to enhance the transient response of the system, a significant factor in control system design, ensuring that the system quickly and effectively reaches its desired design requirements. A two-level approach to solving the inverse optimal control problem is proposed in this work. It involves using semidefinite programming to recover cost function parameters and evaluating the optimality of the solution. Also, we address the problem to finding conditions for minimizing the cost function, estimating parameters Q and R from observed control laws, and applying constraints for well-posedness. It concludes with results demonstrating improved system response and an alternative method that reduces dependence on the K-gain matrix.
In dieser Masterarbeit befassen wir uns mit dem Problem der Identifizierung der Gewichtungsparameter in den Kostenfunktionen, die durch ein optimales Kontrollproblem definiert werden. Da es sich bei dem behandelten Problem um ein inverses Problem handelt, liegt der Schwerpunkt dieser Arbeit auf der Sicherstellung der Wohlgeformtheit von inversen Optimalsteuerungsproblemen, einem entscheidenden Aspekt, der die Machbarkeit, Eindeutigkeit und Stabilität der geschätzten Kostenfunktionen garantiert. In der Studie wird die Methode des linearen quadratischen Reglers (LQR) in einem linearen System angewandt. Im Mittelpunkt dieser Untersuchung steht die Bestimmung der Parameter Q und R im LQR-Ansatz, die eine zentrale Rolle bei der Definition der Effizienz und Effektivität des Steuerungssystems spielen. In der Arbeit wird untersucht, wie diese Parameter optimal gewählt werden können und welchen Einfluss sie auf die Systemleistung haben. Darüber hinaus untersucht die Studie die Verwendung von Nebenbedingungen zur Verbesserung des Einschwingverhaltens des Systems, einem wichtigen Faktor beim Entwurf von Regelsystemen, um sicherzustellen, dass das System die gewünschten Entwurfsanforderungen schnell und effektiv erreicht. In dieser Arbeit wird ein zweistufiger Ansatz zur Lösung des inversen optimalen Steuerungsproblems vorgeschlagen. Dazu gehört die Verwendung der semidefiniten Programmierung, um die Parameter der Kostenfunktion zu ermitteln und die Optimalität der Lösung zu bewerten. Außerdem befassen wir uns mit dem Problem, Bedingungen für die Minimierung der Kostenfunktion zu finden, die Parameter Q und R aus den beobachteten Kontrollgesetzen zu schätzen und Einschränkungen für die Wohlgeformtheit anzuwenden. Abschließend werden Ergebnisse vorgestellt, die eine verbesserte Systemantwort und eine alternative Methode zeigen, die die Abhängigkeit von der K-Gain-Matrix verringert.

Description

Keywords

Control automático--Diseño y construcción, Optimización matemática, Sistemas lineales

Citation

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license

Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess