Predicción de puntos de vista de imágenes 2D usando deep learning

Retamozo Sánchez, Miguel Ángel

Predicción de puntos de vista de imágenes 2D usando deep learning

Archivos

Texto completo (856.55 KB)

Fecha

2019-07-03

Autores

Retamozo Sánchez, Miguel Ángel

Editor

Pontificia Universidad Católica del Perú

URI

http://hdl.handle.net/20.500.12404/14521

Resumen

El objetivo de este artículo es predecir los ángulos que describen los puntos de vista de objetos como (sillas, carros, sofás y televisores) en imágenes reales usando Deep Learning. Para lograrlo se desarrolló un renderizador de imágenes 2D en lenguaje C y se usó la API de openGL como librería gráfica el cual genera imágenes a partir de modelos de objetos 3D del repositorio ModelNet. El presente artículo contribuye con dos métodos para renderizar las imágenes, el primero fue llamado método esférico ya que usa coordenadas esféricas para describir la rotación del objeto y consiste en mantener fijo el objeto 3D en el origen para trasladar la posición de la cámara describiendo círculos de diferente radio a lo largo del eje Z circunscritos en una esfera de radio R, el segundo fue llamado método euleriano ya que usa los ángulos de euler y consiste en mantener fija la posición de la cámara a una distancia R sobre el eje Z y rotar 3 veces por iteración respecto a los ejes Z, X’ y Z”. Se diseñó una red neuronal convolucional basada en la arquitectura de la red VGG la cual fue entrenada con imágenes generada por el renderizador.

Palabras clave

Redes neuronales (Computación), Aprendizaje automático (Inteligencia artificial), C (Lenguaje de programación para computadora), Optimización matemática

Colecciones

Informática con mención en Ciencias de la Computación

Licencia Creative Commons

Excepto donde se indique lo contrario, la licencia de este ítem se describe como info:eu-repo/semantics/openAccess

Ver todos los metadatos en formato Dublin Core

Predicción de puntos de vista de imágenes 2D usando deep learning

Archivos

Fecha

Autores

Título de la revista

ISSN de la revista

Título del volumen

Editor

Acceso al texto completo solo para la Comunidad PUCP

URI

Resumen

Descripción

Palabras clave

Citación

Colecciones

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced

Licencia Creative Commons