Predicción de puntos de vista de imágenes 2D usando deep learning
Date
2019-07-03
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Católica del Perú
Acceso al texto completo solo para la Comunidad PUCP
Abstract
El objetivo de este artículo es predecir los ángulos que describen los puntos de vista de objetos como (sillas, carros, sofás y televisores) en imágenes reales usando Deep Learning. Para lograrlo se desarrolló un renderizador de imágenes 2D en lenguaje C y se usó la API de openGL como librería gráfica el cual genera imágenes a partir de modelos de objetos 3D del repositorio ModelNet. El presente artículo contribuye con dos métodos para renderizar las imágenes, el primero fue llamado método esférico ya que usa coordenadas esféricas para describir la rotación del objeto y consiste en mantener fijo el objeto 3D en el origen para trasladar la posición de la cámara describiendo círculos de diferente radio a lo largo del eje Z circunscritos en una esfera de radio R, el segundo fue llamado método euleriano ya que usa los ángulos de euler y consiste en mantener fija la posición de la cámara a una distancia R sobre el eje Z y rotar 3 veces por iteración respecto a los ejes Z, X’ y Z”. Se diseñó una red neuronal convolucional basada en la arquitectura de la red VGG la cual fue entrenada con imágenes generada por el renderizador.
Description
Keywords
Redes neuronales (Computación), Aprendizaje automático (Inteligencia artificial), C (Lenguaje de programación para computadora), Optimización matemática
Citation
Endorsement
Review
Supplemented By
Referenced By
Creative Commons license
Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess