Absolute long range computer vision based planar position estimation
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Pontificia Universidad Católica del Perú
Acceso al texto completo solo para la Comunidad PUCP
Resumen
La localización precisa es un requisito fundamental en robótica, ya que permite que los sistemas
autónomos naveguen e interactúen de manera eficaz con su entorno. Esta tesis presenta
un enfoque estructurado de localización que aprovecha la codificación y decodificación en el
dominio de la frecuencia para estimar la posición y la orientación con alta precisión. Mediante
una estrategia de codificación basada en señales periódicas, desarrollamos un marco robusto
que extrae de manera eficiente características de localización a partir de imágenes capturadas.
La investigación se divide en dos fases principales: validación mediante simulaciones y evaluación experimental. La fase de simulación explora los fundamentos teóricos del método propuesto,
empleando técnicas de transformada de Fourier y análisis de patrones estructurados para
establecer referencias de rendimiento. La fase experimental implementa el método en una
plataforma de hardware basada en Raspberry Pi equipada con una cámara de obturador global
OV9281, probando su viabilidad en condiciones del mundo real. Se analizan sistemáticamente
desafíos clave como oclusiones, artefactos por movimiento y variabilidad ambiental para evaluar
la robustez del enfoque.
Los resultados demuestran que la codificación estructurada proporciona un rendimiento de localización consistente en diversas resoluciones y condiciones. Si bien las entradas de alta resolución mejoran la precisión, también introducen compromisos computacionales que requieren
optimización para aplicaciones en tiempo real. Además, las comparaciones entre los resultados
simulados y experimentales destacan desviaciones clave causadas por limitaciones del sensor y
variaciones dinámicas de la escena, lo que subraya la importancia de la calibración y técnicas de
preprocesamiento adaptadas al hardware. Al ejecutar el esquema de localización en un sistema
en tiempo real, logramos un error de menos de un tercio de píxel y una tasa de fallos inferior al
1 % en la mayoría de los escenarios.
Accurate localization is a fundamental requirement in robotics, enabling autonomous systems to navigate and interact effectively within their environment. This thesis presents a structured localization approach that leverages frequency-domain encoding and decoding to estimate position and orientation with high precision. By utilizing a periodic signal-based encoding strategy, we develop a robust framework that efficiently extracts localization features from captured images. The research is divided into two main phases: simulation-based validation and experimental evaluation. The simulation phase explores the theoretical underpinnings of the proposed method, employing Fourier transform techniques and structured pattern analysis to establish performance baselines. The experimental phase implements the method on a Raspberry Pibased hardware platform equipped with an OV9281 global shutter camera, testing its feasibility under real-world conditions. Key challenges, including occlusions, motion artifacts, and environmental variability, are systematically analyzed to assess the robustness of the approach. The results demonstrate that structured encoding provides consistent localization performance across varying resolutions and conditions. While high-resolution inputs improve accuracy, they also introduce computational trade-offs that necessitate optimization for real-time applications. Additionally, comparisons between simulated and experimental results highlight key deviations caused by sensor limitations and dynamic scene variations, underscoring the importance of hardware-aware calibration and preprocessing techniques. By performing the localization scheme in a real time system, we achieve an error of less than a third of a pixel, and a failure rate of less than 1 % in most scenarios.
Eine genaue Lokalisierung ist eine grundlegende Anforderung in der Robotik, die es autonomen Systemen erm¨oglicht, in ihrer Umgebung zu navigieren und effektiv zu interagieren. In dieser Arbeit wird ein strukturierter Lokalisierungsansatz vorgestellt, der die Kodierung und Dekodierung im Frequenzbereich nutzt, um Position und Orientierung mit hoher Pr¨azision zu sch¨atzen. Durch den Einsatz einer auf periodischen Signalen basierenden Kodierungsstrategie entwickeln wir einen robusten Rahmen, der Lokalisierungsmerkmale effizient aus aufgenommenen Bildern extrahiert. Die Forschung gliedert sich in zwei Hauptphasen: simulationsbasierte Validierung und experimentelle Bewertung. In der Simulationsphase werden die theoretischen Grundlagen der vorgeschlagenen Methode untersucht, wobei Fourier-Transformationstechniken und strukturierte Musteranalysen eingesetzt werden, um Leistungsgrundlagen zu schaffen. In der experimentellen Phase wird die Methode auf einer Raspberry Pi-basierten Hardwareplattform mit einer OV9281 Global-Shutter-Kamera implementiert und ihre Machbarkeit unter realen Bedingungen getestet. Die wichtigsten Herausforderungen, darunter Verdeckungen, Bewegungsartefakte und Umgebungsvariabilit¨at, werden systematisch analysiert, um die Robustheit des Ansatzes zu bewerten. Die Ergebnisse zeigen, dass die strukturierte Kodierung eine konsistente Lokalisierungsleistung bei unterschiedlichen Aufl¨osungen und Bedingungen bietet. W¨ahrend hochaufl¨osende Eingaben die Genauigkeit verbessern, f¨uhren sie auch zu rechnerischen Kompromissen, die eine Optimierung f¨ur Echtzeitanwendungen erforderlich machen. Dar¨uber hinaus heben Vergleiche zwischen simulierten und experimentellen Ergebnissen wichtige Abweichungen hervor, die durch Sensorbegrenzungen und dynamische Szenevariationen verursacht werden, und unterstreichen die Bedeutung von hardwarenahen Kalibrierungs- und Vorverarbeitungsmethoden. Indem wir das Lokalisierungsschema in einem Echtzeitsystem durchf¨uhren, erreichen wir einen Fehler von weniger als einem Drittel eines Pixels und eine Fehlerrate von weniger als 1 % in den meisten Szenarien.
Accurate localization is a fundamental requirement in robotics, enabling autonomous systems to navigate and interact effectively within their environment. This thesis presents a structured localization approach that leverages frequency-domain encoding and decoding to estimate position and orientation with high precision. By utilizing a periodic signal-based encoding strategy, we develop a robust framework that efficiently extracts localization features from captured images. The research is divided into two main phases: simulation-based validation and experimental evaluation. The simulation phase explores the theoretical underpinnings of the proposed method, employing Fourier transform techniques and structured pattern analysis to establish performance baselines. The experimental phase implements the method on a Raspberry Pibased hardware platform equipped with an OV9281 global shutter camera, testing its feasibility under real-world conditions. Key challenges, including occlusions, motion artifacts, and environmental variability, are systematically analyzed to assess the robustness of the approach. The results demonstrate that structured encoding provides consistent localization performance across varying resolutions and conditions. While high-resolution inputs improve accuracy, they also introduce computational trade-offs that necessitate optimization for real-time applications. Additionally, comparisons between simulated and experimental results highlight key deviations caused by sensor limitations and dynamic scene variations, underscoring the importance of hardware-aware calibration and preprocessing techniques. By performing the localization scheme in a real time system, we achieve an error of less than a third of a pixel, and a failure rate of less than 1 % in most scenarios.
Eine genaue Lokalisierung ist eine grundlegende Anforderung in der Robotik, die es autonomen Systemen erm¨oglicht, in ihrer Umgebung zu navigieren und effektiv zu interagieren. In dieser Arbeit wird ein strukturierter Lokalisierungsansatz vorgestellt, der die Kodierung und Dekodierung im Frequenzbereich nutzt, um Position und Orientierung mit hoher Pr¨azision zu sch¨atzen. Durch den Einsatz einer auf periodischen Signalen basierenden Kodierungsstrategie entwickeln wir einen robusten Rahmen, der Lokalisierungsmerkmale effizient aus aufgenommenen Bildern extrahiert. Die Forschung gliedert sich in zwei Hauptphasen: simulationsbasierte Validierung und experimentelle Bewertung. In der Simulationsphase werden die theoretischen Grundlagen der vorgeschlagenen Methode untersucht, wobei Fourier-Transformationstechniken und strukturierte Musteranalysen eingesetzt werden, um Leistungsgrundlagen zu schaffen. In der experimentellen Phase wird die Methode auf einer Raspberry Pi-basierten Hardwareplattform mit einer OV9281 Global-Shutter-Kamera implementiert und ihre Machbarkeit unter realen Bedingungen getestet. Die wichtigsten Herausforderungen, darunter Verdeckungen, Bewegungsartefakte und Umgebungsvariabilit¨at, werden systematisch analysiert, um die Robustheit des Ansatzes zu bewerten. Die Ergebnisse zeigen, dass die strukturierte Kodierung eine konsistente Lokalisierungsleistung bei unterschiedlichen Aufl¨osungen und Bedingungen bietet. W¨ahrend hochaufl¨osende Eingaben die Genauigkeit verbessern, f¨uhren sie auch zu rechnerischen Kompromissen, die eine Optimierung f¨ur Echtzeitanwendungen erforderlich machen. Dar¨uber hinaus heben Vergleiche zwischen simulierten und experimentellen Ergebnissen wichtige Abweichungen hervor, die durch Sensorbegrenzungen und dynamische Szenevariationen verursacht werden, und unterstreichen die Bedeutung von hardwarenahen Kalibrierungs- und Vorverarbeitungsmethoden. Indem wir das Lokalisierungsschema in einem Echtzeitsystem durchf¨uhren, erreichen wir einen Fehler von weniger als einem Drittel eines Pixels und eine Fehlerrate von weniger als 1 % in den meisten Szenarien.
Descripción
Palabras clave
Robótica--Sistema de localización automática, Métodos de simulación, Procesamiento de imágenes--Técnicas digitales