2. Maestría

Permanent URI for this communityhttp://98.81.228.127/handle/20.500.12404/2

Tesis de la Escuela de Posgrado

Browse

Search Results

Now showing 1 - 10 of 25

Control de aprendizaje profundo basado en un control predictivo por modelo no lineal para un vehículo submarino no tripulado
(Pontificia Universidad Católica del Perú, 2024-11-29) Gallardo Rodríguez, Manuel Enrique; Portella Delgado, Jhon Manuel
La presente tesis propone un algoritmo para el entrenamiento de una red neuronal con algoritmos de Redes Neuronales Profundas (Deep Learning) en combinación con un control predictivo basado en modelos no lineal (NLMPC - Non Linear Model Predictive Control) para el entrenamiento de vehículos submarinos. El interés por el desarrollo de sistemas autónomos se incrementó considerablemente en los últimos años. Sectores como el industrial y militar han desarrollado esta tecnología con la finalidad de implementar futuros proyectos vinculados especialmente a la navegación autónoma. Este tipo de navegación se basa en sistemas de control en tiempo real que identifican el entorno que rodea al vehículo con la finalidad de tomar decisiones de desplazamiento en función de las restricciones mecánicas del vehículo y físicas del entorno. Los sistemas de Control Predictivo en Base a Modelos o MPC por sus siglas en inglés Model Predictive Control, han sido usados de manera satisfactoria para el control de vehículos submarinos. Sin embargo, su aplicación requiere estimar los estados del sistema en todo momento, lo cual tiene un coste computacional muy alto en entornos complejos como el medio submarino. Por otro lado, los sistemas de control con Redes Neuronales, no necesitan estimar de manera explícita la dinámica del modelo, pues obtienen una política que relaciona las entradas del sistema con las acciones finales, mejorando de esta manera el control de sistemas complejos a través de Redes Neuronales constituidas por muchas capas ocultas, sin caer en el error de acumulación de error durante la etapa de entrenamiento. En este escenario, el presente trabajo tiene como objetivo el control de un robot submarino no tripulado, basado en una combinación del sistema de control no lineal MPC y una Red Neuronal entrenada con algoritmos de aprendizaje profundo (Deep Learning). El control no lineal MPC suministraría la información necesaria a la Red Neuronal durante la etapa de entrenamiento, posteriormente la Red Neuronal podría controlar el movimiento del robot submarino sin la necesidad de conocer todos los estados del vehículo y a un coste computacional mucho menor.
Diseño estructural preliminar automatizado de edificaciones de concreto armado usando redes neuronales artificiales
(Pontificia Universidad Católica del Perú, 2024-11-07) Cusiquispe Rocca, Roy; Velásquez Vargas, José Martín; Rodríguez Reyna, Carlos Alberto
El diseño estructural de edificaciones involucra procesos repetitivos que buscan determinar las dimensiones adecuadas de los elementos estructurales y los parámetros sismorresistentes, que cumplan los requerimientos mínimos de la Normativa Técnica Peruana. Estos procesos son tediosos, propensos a errores y produce pérdidas de tiempo; haciendo que el diseño estructural sea, ineficiente y sobredimensionado, derivando en un mayor uso de materiales de construcción e incremento del costo de construcción. Para evitar estos problemas, la presente investigación tiene el objetivo de realizar un diseño estructural preliminar automatizado de edificaciones de concreto armado usando Redes Neuronales Artificiales (RNA). Para alcanzar este objetivo se construyeron modelos de RNA, que tienen la capacidad de predecir ratios, que permiten estimar la geometría de los muros estructurales (placas) y columnas, además, predecir parámetros sismorresistentes: periodos, derivas máximas, desplazamientos máximos del último nivel y cortante basal. La estructura de las RNA, estuvo compuesta por: una capa de entrada, formada por las características geométricas y sísmicas, que caracterizan a las edificaciones, extraídas de 51 proyectos existentes con sistemas estructurales: muros estructurales, y dual; ubicados en la ciudad de Lima; una capa oculta, que proporciona robustes y eficacia; y una capa de salida, compuesta por los valores objetivo: ratio de muros estructurales (placas), ratio de columnas, y parámetros sismorresistentes. Los resultados finalizaron con la construcción de 11 modelos de RNA, estos fueron entrenados, validados y probados. En la etapa final se implementó los modelos de RNA en un caso práctico, logrando resultados coherentes a un diseño estructural convencional. En conclusión, se demostró que las Redes Neuronales Artificiales tienen la capacidad de desarrollar un diseño estructural preliminar; con un mínimo Error Medio Cuadrático (MSE) y con valores de R cuadrado ajustado superior al 83% y 77%, para la predicción de ratio de muros estructurales y columnas, y parámetros sismorresistentes, respectivamente.
Aprendizaje profundo para transcripción de textos históricos manuscritos en español
(Pontificia Universidad Católica del Perú, 2024-07-16) Choque Dextre, Gustavo Jorge; Beltrán Castañón, Cesar Armando
El reconocimiento de textos historicos es considerado un problema desafiante debido a los muchos factores que ´ alteran el estado de los manuscritos y la complejidad de los diferentes estilos de escritura involucrados en este tipo de documentos; en los anos recientes se han creado muchos modelos de Reconocimiento de textos manuscritos ˜ enfocados en diversos idiomas como el ingles, chino, ´ arabe y japon ´ es entre otros, sin embargo no se han ´ encontrado muchas iniciativas de reconocimiento de texto orientadas al idioma espanol debido fundamentalmente ˜ a un escasez de datasets publicos disponibles para ayudar a solucionar la problem ´ atica en dicho idioma. ´ En esta publicacion se presenta la aplicaci ´ on de t ´ ecnicas de Deep Learning basadas en una arquitectura de ´ red neuronal encoder-decoder y convoluciones compuerta Gated-CNN las cuales en los ultimos ha demostrado ´ resultados sobresalientes para resolver dicha problematica, as ´ ´ı mismo se propone la aplicacion de mecanismos de ´ Transferencia de Aprendizaje para el reconocimiento de textos historicos en espa ´ nol. Los experimentos demuestran ˜ que la aplicacion de estos m ´ etodos puede brindar resultados sobresalientes, adem ´ as la aplicaci ´ on de otras t ´ ecnicas ´ tales como Aumentacion de Datos y Modelos de Lenguaje conllevan a mejoras significativas en los resultados finales. ´ Se propone ademas el uso de un nuevo dataset de textos hist ´ oricos en espa ´ nol conformado por 1000 elementos ˜ tomados de textos historicos peruanos referentes al siglo XVIII.
Clasificación automática de eventos en videos de fútbol utilizando redes convolucionales profundas
(Pontificia Universidad Católica del Perú, 2024-06-21) Laboriano Galindo, Alipio; Beltrán Castañón, César Armando
La forma en que las nuevas generaciones consumen y experimentan el deporte especialmente el fútbol, ha generado oportunidades significativas en la difusión de contenidos deportivos en plataformas no tradicionales y en formatos más reducidos. Sin embargo, recuperar información con contenido semántico de eventos deportivos presentados en formato de video no es tarea sencilla y plantea diversos retos. En videos de partidos de fútbol entre otros retos tenemos: las posiciones de las cámaras de grabación, la superposición de eventos o jugadas y la ingente cantidad de fotogramas disponibles. Para generar resúmenes de calidad y que sean interesantes para el aficionado, en esta investigación se desarrolló un sistema basado en Redes Convolucionales Profundas para clasificar automáticamente eventos o jugadas que ocurren durante un partido de fútbol. Para ello se construyó una base de datos a partir de videos de fútbol descargados de SoccerNet, la cual contiene 1,959 videoclips de 5 eventos: saques de meta, tiros de esquina, faltas cometidas, tiros libres indirectos y remates al arco. Para la experimentación se utilizó técnicas de preprocesamiento de video, una arquitectura convolucional propia y se aplicó transfer learning con modelos como ResNet50, EfficientNetb0, Visión Transformers y Video Visión Transformers. El mejor resultado se obtuvo con una EfficentNetb0 modificada en su primera capa convolucional, con la cual se obtuvo un 91% accuracy, y una precisión de 100% para los saques de meta, 92% para los tiros de esquina, 90% para las faltas cometidas, 88% para los tiros libres indirectos y 89% para los remates al arco.
A lowpower recording system for intracortical signal acquisition based on design specification relaxation and lower bandwidth filtering
(Pontificia Universidad Católica del Perú, 2024-01-19) Vitón Zorrilla, Luighi Anthony; Saldaña Pumarica, Julio César
In this thesis, we designed and evaluated a circuit model at the transistor level of a low-resolution and low bandwidth ADC (analog-to-digital converter) with level-crossing architecture (LCADC), used as part of the acquisition chain of a BCI (brain-to-computer interface) device. The aim is to obtain minimal specifications that could return adequate levels of accuracy at spike detection and reduce power dissipation. In addition, we included a NEO preprocessor in the test to help in the detection accuracy. To achieve the objectives proposed, we started developing a software model for the preprocessor and the ADCs to evaluate the different variations of resolution, bandwidth, noise level, and NEO window. After finding the desired minimum values, we continued with the hardware development of the ADC. We designed the level crossing architecture and a conventional SAR to have a reference against which we compare the LCADC performance. After that, we developed a NEO circuit and applied synthesized neural recordings to evaluate power consumption with the ADC. Additionally, we designed a conventional analog frontend to estimate the power for the band of interest. Also, we estimated the dissipation for wireless transmission by calculating the approximated data stream expected in the level-crossing sampling scheme. Summing them, we obtained the power consumption of the complete acquisition chain. In conclusion, although reducing the intrinsic power of the LCADC is challenging, the scheme helps reduce the total power consumption of the acquisition chain with adequate accuracy, making it competitive against currently reported BCI devices.
Pronóstico del precio de cobre utilizando técnicas de aprendizaje profundo
(Pontificia Universidad Católica del Perú, 2023-03-06) Carhuas Ñañez, Milton Cesar; Villanueva Talavera, Edwin Rafael
Pronosticar los precios futuros de cobre es una tarea desafiante dadas las características dinámicas y no lineales de varios factores que afectan el precio del cobre. Este artículo describe modelos de pronóstico, basados en arquitecturas de redes neuronales, para predecir los retornos del precio de cobre en tres horizontes de tiempo: un día, una semana y un mes adelante. Diversas variables se consideran como variables de entrada, como los precios históricos de diferentes materias primas metálicas y variables macroeconómicas globales. Evaluamos los modelos con datos diarios de 2007 a 2020. Los resultados experimentales mostraron que los modelos de salida única presentan un mejor rendimiento predictivo que los modelos de salida múltiple. Las arquitecturas de mejor rendimiento fueron los modelos de memorias largas a corto plazo (LSTM) en datos de prueba.
Corrector ortográfico neuronal para errores ortográficos multilingües adversarios para lenguas amazónicas peruanas
(Pontificia Universidad Católica del Perú, 2022-11-09) Cardoso Yllanes, Gerardo; Gómez Montoya, Héctor Erasmo
Para combatir los ataques de ejemplos adversarios, se propuso implementar un modelo de reconocimiento de palabras y entrenarlo con oraciones creadas a través de diferentes técnicas de generación de data aumentada para cuatro lenguas amazónicas peruanas de pocos recursos: Shipibo-Konibo, Asháninka, Yanesha y Yine. Observamos que, para la gran mayoría de experimentos, el modelo propuesto logró corregir oraciones con palabras con errores ortográficos. Los modelos que fueron entrenados mediante oraciones creadas a través de los canales de errores de ambigüedad fonema-grafema y desnormalización; y, el modelo de ensamble, se desempeñaron mejor al momento de evaluarlos con los corpus creados por profesores de las lenguas. Finalmente, se implementó un prototipo del corrector ortográfico neuronal, en donde se encuentran todos los modelos entrenados en la presente investigación.
Minería web de textos en lenguas indígenas para desarrollar tecnologías de lenguaje. Caso de estudio: quechua sureño
(Pontificia Universidad Católica del Perú, 2022-11-09) Ubaldo Gamarra, Victoria Alejandra; Oncevay Marcos, Felix Arturo
En la actualidad, para los más de 30 millones de peruanos, la información a la que accedemos se encuentra mayormente en el idioma español. Sin embargo Perú es un país multilingüe, posee una gran riqueza cultural y lingüística con alrededor de 47 lenguas originarias. Para esta población encontrar textos, noticias y contenido en internet en su lengua nativa es una tarea complicada. Existe un limitado acceso a información como lecturas, textos, noticias u otros contenidos que en modalidad digital es muy escaso. Esto se debe a que los pocos ciudadanos que se comunican en lenguas nativas son de manera oral y algunos hacen uso del español sobre sus lenguas nativas. De ese modo, existen investigaciones en el campo de la inteligencia artificial donde a partir del poco material digital recolectado de lenguas nativas se construyeron corpus digitales para tareas de traducción automática y detección del lenguaje. Sin embargo, aún son corpus pequeños para elaborar traductores de calidad, presentan complicaciones en traducir textos completos, y además díficil el aprendizaje con algoritmos complejos, como redes neuronales profundas. Por este motivo se propone realizar una minería web de textos en la lengua originaria quechua sureño para incrementar la cantidad de oraciones y diversidad de dominios, evaluar la calidad de los nuevos textos en un modelo de traducción automática de quechua a español, y desarrollar una web de libre acceso de consulta al corpus creado.
Modelos de detección de emociones en texto y rostros para agentes conversacionales multimodales
(Pontificia Universidad Católica del Perú, 2022-04-06) Balbuena Galván, José Guillermo; Beltrán Castañón, César Armando
El presente trabajo de investigación aborda la implementación, análisis y selección de distintos modelos de redes neuronales recurrentes (RNN) y convolucionales (CNN) para la detección de emociones en texto y rostros; los cuales pueden ser utilizados como módulos adicionales en agentes conversacionales de tiempo real como son chatbots o robots sociales. Los módulos de detección permiten a los agentes conversacionales poder entender cómo se sienten las personas durante la interacción con ellas; conociendo estos estados los agentes conversacionales pueden responder empáticamente. En primer lugar, se revisará la literatura sobre como los agentes conversacionales buscan ser más empáticos, así como los métodos de detección de emociones mediante distintos canales como texto y rostros. Luego, se procede a recolectar y pre-procesar bases de datos públicas para el entrenamiento de los algoritmos seleccionados en base a la literatura. Finalmente, métricas tanto para la evaluación del rendimiento de predicción multiclase (Accuracy, Precision, Recall y F1), como la velocidad de procesamiento (ej. Framesper- second) son seleccionadas y analizadas para determinar cuáles son los mejores algoritmos para implementar una aplicación de tiempo real.
Sperm cell segmentation in digital micrographs based on convolutional neural networks using u-net architecture
(Pontificia Universidad Católica del Perú, 2021-08-11) Melendez Melendez, Roy Kelvin; Beltrán Castañón, César Armando
Human infertility is considered a serious disease of the the reproductive system that affects more than 10% of couples worldwide,and more than 30% of reported cases are related to men. The crucial step in evaluating male in fertility is a semen analysis, highly dependent on sperm morphology. However,this analysis is done at the laboratory manually and depends mainly on the doctor’s experience. Besides,it is laborious, and there is also a high degree of interlaboratory variability in the results. This article proposes applying a specialized convolutional neural network architecture (U-Net),which focuses on the segmentation of sperm cells in micrographs to overcome these problems.The results showed high scores for the model segmentation metrics such as precisión (93%), IoU score (86%),and DICE score of 93%. Moreover,we can conclude that U-net architecture turned out to be a good option to carry out the segmentation of sperm cells.

2. Maestría

Browse

Filters

Settings

Sort By

Results per page

Search Results