Informática con mención en Ciencias de la Computación

Now showing 1 - 4 of 4

Diseño de una arquitectura de aprendizaje automático que brinde soporte para la detección de mentiras mediante el análisis de video
(Pontificia Universidad Católica del Perú, 2019-07-30) Salas Guillén, Diego Andrés; Sipiran Mendoza, Iván Anselmo
La justicia y la búsqueda de la verdad en la investigación criminal requiere del uso de una herramienta fundamental para su éxito, el interrogatorio. En un interrogatorio, un experto hace uso de su experiencia y su juicio para, mediante el cuestionamiento del acusado, obtener una verdad explícita o implícita de parte de este sobre el hecho a investigar. El presente proyecto de investigación apunta a diseñar un modelo de aprendizaje automático que brinde soporte para la detección de mentiras en interrogatorios mediante el análisis de video. Es una contribución a los trabajos de investigación realizados por el grupo IA-PUCP (Grupo de Investigación en Inteligencia Artificial) de la Pontificia Universidad Católica del Perú. Se utilizó un conjunto de datos puesto a disponibilidad por Rada Mihalcea del grupo “Language and Information Technologies” de la Universidad de Michigan. La propuesta de arquitectura para el modelo consiste en una capa de preprocesamiento de datos que utiliza un algoritmo de reconocimiento facial para extraer los rostros del video, limitando el espacio de características. Luego, se utiliza una red convolucional preentrenada para realizar la extracción de características. Finalmente, se utiliza una red recurrente LSTM para procesar las características y luego una red neuronal para clasificar los videos. Se experimentó con cinco redes convolucionales (Resnet, InceptionV3, Xception, VGG16 y VGG19), el mejor fue InceptionV3. Este obtuvo una exactitud de 78.6 %, valor que supera varios de los resultados obtenidos por los modelos, presentados en la publicación “A Multi-View Learning Approach to Deception Detection” de N. Carissimi, que no aplicaron entrenamiento en la extracción convolucional. Esto, utilizando menos información y automatizando la extracción de la misma.
Predicción de puntos de vista de imágenes 2D usando deep learning
(Pontificia Universidad Católica del Perú, 2019-07-03) Retamozo Sánchez, Miguel Ángel; Sipiran Mendoza, Iván Anselmo
El objetivo de este artículo es predecir los ángulos que describen los puntos de vista de objetos como (sillas, carros, sofás y televisores) en imágenes reales usando Deep Learning. Para lograrlo se desarrolló un renderizador de imágenes 2D en lenguaje C y se usó la API de openGL como librería gráfica el cual genera imágenes a partir de modelos de objetos 3D del repositorio ModelNet. El presente artículo contribuye con dos métodos para renderizar las imágenes, el primero fue llamado método esférico ya que usa coordenadas esféricas para describir la rotación del objeto y consiste en mantener fijo el objeto 3D en el origen para trasladar la posición de la cámara describiendo círculos de diferente radio a lo largo del eje Z circunscritos en una esfera de radio R, el segundo fue llamado método euleriano ya que usa los ángulos de euler y consiste en mantener fija la posición de la cámara a una distancia R sobre el eje Z y rotar 3 veces por iteración respecto a los ejes Z, X’ y Z”. Se diseñó una red neuronal convolucional basada en la arquitectura de la red VGG la cual fue entrenada con imágenes generada por el renderizador.
Fusión de datos para segmentación semántica en aplicaciones urbanas de teledetección aérea usando algoritmos de aprendizaje profundo
(Pontificia Universidad Católica del Perú, 2019-06-27) Chicchón Apaza, Miguel Angel; Sipiran Mendoza, Iván Anselmo
La creciente urbanización requiere un mapeo y monitoreo preciso del sistema urbano para planificar futuros desarrollos. La teledetección permite obtener información de la superficie de la Tierra y a partir de esta comprender el proceso de urbanización. Esta información hoy en dia puede ser obtenida en forma masiva utilizando vehículos aéreos no tripulados. Esta información puede ser variada incluyendo imágenes ópticas rgb, multiespectrales y modelos digitales de superficie, generandose la necesida de contar con técnicas de fusión multisensorial eficientes y efectivas para explotarlas completamente. La segmentación semántica en teledetección urbana permite la interpretación automática de los datos y es útil en tareas como el mapeo de la cobertura terrestre y la planificación urbana. Actualmente, el aprendizaje profundo se ha vuelto de interés en Visión por computador y Teledetección, existiendo diferentes estudios de la aplicación de variantes de redes neuronales convolucionales (CNN) en segmentación semántica. En el presente trabajo de tesis se investiga la utilización de métodos de fusión de datos basado en algoritmos de aprendizaje profundo para la segmentación semántica en aplicaciones urbanas de teledetección.
3D Reconstruction of Incomplete Archaeological Objects Using a Generative Adversarial Network
(Pontificia Universidad Católica del Perú, 2018-07-09) Hermoza Aragonés, Renato; Sipiran Mendoza, Iván Anselmo
We introduce a data-driven approach to aid the repairing and conservation of archaeological objects: ORGAN, an object reconstruction generative adversarial network (GAN). By using an encoder-decoder 3D deep neural network on a GAN architecture, and combining two loss objectives: a completion loss and an Improved Wasserstein GAN loss, we can train a network to effectively predict the missing geometry of damaged objects. As archaeological objects can greatly differ between them, the network is conditioned on a variable, which can be a culture, a region or any metadata of the object. In our results, we show that our method can recover most of the information from damaged objects, even in cases where more than half of the voxels are missing, without producing many errors.

Informática con mención en Ciencias de la Computación

Browse

Filters

Settings

Sort By

Results per page

Search Results