Predicción de puntos de vista de imágenes 2D usando deep learning

Thumbnail Image

Date

2019-07-03

Journal Title

Journal ISSN

Volume Title

Publisher

Pontificia Universidad Católica del Perú

Acceso al texto completo solo para la Comunidad PUCP

Abstract

El objetivo de este artículo es predecir los ángulos que describen los puntos de vista de objetos como (sillas, carros, sofás y televisores) en imágenes reales usando Deep Learning. Para lograrlo se desarrolló un renderizador de imágenes 2D en lenguaje C y se usó la API de openGL como librería gráfica el cual genera imágenes a partir de modelos de objetos 3D del repositorio ModelNet. El presente artículo contribuye con dos métodos para renderizar las imágenes, el primero fue llamado método esférico ya que usa coordenadas esféricas para describir la rotación del objeto y consiste en mantener fijo el objeto 3D en el origen para trasladar la posición de la cámara describiendo círculos de diferente radio a lo largo del eje Z circunscritos en una esfera de radio R, el segundo fue llamado método euleriano ya que usa los ángulos de euler y consiste en mantener fija la posición de la cámara a una distancia R sobre el eje Z y rotar 3 veces por iteración respecto a los ejes Z, X’ y Z”. Se diseñó una red neuronal convolucional basada en la arquitectura de la red VGG la cual fue entrenada con imágenes generada por el renderizador.

Description

Keywords

Redes neuronales (Computación), Aprendizaje automático (Inteligencia artificial), C (Lenguaje de programación para computadora), Optimización matemática

Citation

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license

Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess