Integración de información de profundidad en la segmentación de instancias para su aplicación en RGB-D SLAM en entornos interiores dinámicos

Autores

Laurel Bravo, Christihan Joel

Título de la revista

ISSN de la revista

Título del volumen

Editor

Pontificia Universidad Católica del Perú

Acceso al texto completo solo para la Comunidad PUCP

Resumen

El presente trabajo de investigación aborda la modificación de modelos de segmentación de instancias para incorporar información de profundidad (imagen de profundidad) como entrada adicional. Se consideran tres variantes posibles en estas modificaciones, con el objetivo de evaluar y seleccionar la mejor de ellas. Para medir el rendimiento de los modelos, se utilizan las métricas de precisión media promedio (mAP) y cuadros por segundo (FPS). En primer lugar, se realiza una revisión bibliográfica sobre la integración de información de profundidad en modelos de segmentación de instancias, destacando las metodologías y enfoques más relevantes. Posteriormente, se implementan y entrenan los modelos modificados (variantes) utilizando una bases de datos adecuada que contengan tanto imágenes como información de profundidad. Las variantes de los modelos son evaluadas en términos de mAP y FPS para determinar su rendimiento y eficacia. A partir de esta evaluación, se selecciona la mejor variante y se realiza una optimización de hiperparámetros con el fin de determinar si es posible mejorar aún más su rendimiento. Finalmente, se compara el rendimiento de la variante optimizada con la línea base a fin de determinar su eficacia para escenarios conocidos y nuevos. Se considera como criterio principal la métrica mAP y se verifica el cumplimiento de los FPS necesario para su uso en tiempo real en conjunto con un algoritmo de vSLAM.

Descripción

Palabras clave

Procesamiento de imágenes, Robótica, Algoritmos--Aplicaciones

Citación

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced