3. Licenciatura
Permanent URI for this communityhttp://98.81.228.127/handle/20.500.12404/3
Tesis de todas las facultades
Browse
6 results
Search Results
Item Modelo de red neuronal convolucional para la clasificación de tipos de nubes en imágenes de webcam(Pontificia Universidad Católica del Perú, 2025-01-14) Andonaire Tuesta, Mario Alejandro; Beltrán Castañón, César Armando; Villanueva Talavera, Edwin RafaelLa presente investigación aborda la problemática de la clasificación manual de tipos de nubes en estaciones meteorológicas del Servicio Nacional de Meteorología e Hidrología del Perú (SENAMHI), un proceso sujeto a errores y demandante de tiempo. El estudio justifica su relevancia destacando la importancia de la observación precisa de nubes en la meteorología y cómo la automatización mediante una herramienta de clasificación basada en redes neuronales convolucionales podría optimizar este procedimiento. Este trabajo se enmarca dentro del proyecto Meteo-Huascarán, en colaboración con el SENAMHI y el grupo de investigación IAPUCP. El método empleado consiste en el entrenamiento de un modelo de red neuronal convolucional, utilizando aprendizaje supervisado para clasificar automáticamente los tipos de nubes a partir de imágenes tomadas desde tierra. La investigación contempla la preparación de una base de datos representativa, la implementación de tres arquitecturas de redes neuronales y la selección de la más adecuada mediante una evaluación comparativa. Además, el desarrollo una interfaz web para mostrar el funcionamiento del modelo. Los resultados muestran un avance en la automatización de la clasificación de tipos de nubes, seleccionando la arquitectura Inception v3 como la más adecuada para el proyecto. La implementación de la interfaz web facilita la interacción con el modelo, permitiendo la carga de imágenes de nubes y obteniendo la clasificación correspondiente de forma automática. Este trabajo contribuye a la automatización del proceso de clasificación de tipos de nubes en el SENAMHI, proponiendo una solución tecnológica que reduce la dependencia de observadores humanos y mejora la eficiencia y precisión en la observación meteorológica. La implementación de este modelo representa un paso adelante hacia la modernización y adaptación a las necesidades futuras en el campo de la meteorología en el Perú.Item Determinación y segmentación del nivel socio-económico a partir del análisis automático de imágenes de satélite(Pontificia Universidad Católica del Perú, 2022-07-11) Sosa Pezo, Carlos Alberto; Beltrán Castañón, César ArmandoEste proyecto tiene como objetivo desarrollar un modelo de análisis de imágenes satelitales basado en redes neuronales profundas para poder identificar de forma automática el nivel socioeconómico de zonas urbanas, a través de la utilización de las imágenes obtenidas mediante el satélite estatal peruano PerúSat-1, las cuales fueron provistas al proyecto por la Comisión Nacional de Investigación y Desarrollo Aeroespacial (CONIDA). De esta manera, se buscó proveer una fuente alternativa y complementaria a los métodos manuales de recolección de datos demográficos para los casos en los que esta metodología tradicional no resulta conveniente de ejecutar por factores de tiempo y presupuesto. Para ello, el proyecto inicia con la conformación del corpus de datos utilizados para el entrenamiento del modelo de análisis de imágenes satelitales. Este conjunto de datos incorpora, además de imágenes satelitales de PerúSat-1 de la ciudad de Lima capturadas entre 2016 y 2020, una serie de etiquetas que indican el nivel de ingresos de cada manzana en dicha ciudad. Estas etiquetas son el resultado de un estudio elaborado por el Instituto Nacional de Estadística e Informática en el año 2019, tomando como base los datos obtenidos durante el Censo Nacional de Población y Vivienda de 2017. En el caso de las imágenes satelitales, este proceso consiste en la composición en imágenes de cuatro bandas (rojo, azul, verde e infrarrojo) de alta resolución y su posterior división en bloques cuadrados de 512 píxeles en cada dimensión; mientras que las etiquetas censales son organizadas en una base de datos relacional, de forma que puedan ser accedidas por el script para la integración de ambas fuentes de datos. Finalmente, se asigna a cada bloque de 512 x 512 píxeles una máscara con las etiquetas censales correspondientes a la zona capturada. Luego, se define un protocolo de preprocesamiento de los datos, en el que normalizan los parches de las imágenes satelitales, además de incrementar el tamaño del conjunto de datos, de modo que sean adecuados para el entrenamiento de los modelos desarrollados. Respecto a estos, se dispone de dos modelos de redes neuronales convolucionales para el análisis socioeconómico de las imágenes satelitales: el primero, encargado de segmentar semánticamente los techos observados en las imágenes; y el segundo que, recibiendo como entradas la imágen satelital original y la máscara de techos generada por el modelo anterior, detecta el nivel socioeconómico de cada manzana en dicha imagen. Así, se obtiene como resultado final una máscara de bits en la que se indica el nivel socioeconómico de cada manzana observada en la imagen satelital. Finalmente, para facilitar su acceso hacia el usuario final, se desarrolla una plataforma web, compuesta por una interfaz gráfica y una interfaz de programación de aplicaciones, que permite seleccionar, con la ayuda de un mapa en la interfaz gráfica, imágenes satelitales para que sean procesadas por los modelos de redes neuronales y puedan ser las máscaras generadas visualizadas en conjunto con la imagen original.Item Desarrollo de un Framework para la identificación del nivel de complejidad de texto para el entrenamiento de chatbots basado en Machine Learning(Pontificia Universidad Católica del Perú, 2022-03-21) Matos Rios, Hans; Beltrán Castañón, César ArmandoLa generación de diálogo implica diseñar un programa para generar una conversación natural, esto requiere desarrollar algoritmos que puedan conversar con un ser humano y otro programa de manera coherente y fluida. Desarrollar una conversación también depende del contexto y conocimiento del interlocutor, lo cual nos lleva a definir la existencia de niveles de complejidad conversacional, la cual se refiere a determinar que tan fácil o difícil de leer es un texto. En este aspecto, especialmente para el idioma español, no existe una herramienta que tenga un módulo propio que le permita clasificar textos en español por su complejidad textual. En el presente trabajo de fin de carrera se realiza el desarrollo de un módulo en el lenguaje de programación Python, el cual funciona como un Framework para identificar la complejidad textual de textos en español usando técnicas de Machine Learning. Para ello, en primer lugar, se implementaron 48 métricas de análisis de complejidad textual basadas en Coh-Metrix usando el lenguaje de programación Python. Dichas métricas convierten textos en español en datos numéricos con los cuales se entrenaron distintos modelos de Machine Learning, con el motivo de obtener el mejor modelo a utilizar con el Framework desarrollado, siendo este capaz de utilizar un modelo personalizado provisto por el usuario. Para ello, se necesitó obtener un corpus de 183 textos en español para realizar dicho entrenamiento, el cual fue obtenido al descargar textos educativos de nivel primaria y secundaria. Por último, se entrenó un chatbot con los textos obtenidos para el corpus, cuyas respuestas generadas fueron analizados con el Framework previamente desarrollado, identificando que el nivel de complejidad de dichas respuestas correspondía al nivel de los textos con los cuales el chatbot fue entrenado. En conclusión, en el presente proyecto de investigación se desarrolla un módulo de Python que funciona como un Framework, el cual es capaz de identificar la complejidad textual de textos en español, ya sea con el mejor modelo de Machine Learning utilizado en el presente proyecto o utilizando uno provisto por el usuario de la herramienta.Item Análisis de sentimiento en información de medios periodísticos y redes sociales mediante redes neuronales recurrentes(Pontificia Universidad Católica del Perú, 2022-02-06) Zarate Calderon, Gabriel Helard; Beltrán Castañón, César ArmandoEl análisis de sentimiento es un área de investigación importante en el procesamiento de lenguaje natural, la cual está en constante crecimiento especialmente por la generación de grandes volúmenes de información textual, y el avance tecnológico en lo que se refiere al almacenamiento y los algoritmos inteligentes para el análisis de esta. Esta tarea cada vez va tomando más fuerza su uso en diferentes aplicaciones computacionales dado el crecimiento exponencial del uso de medios digitales y redes sociales, las cuales, gracias a la información debidamente procesada, pueden ser muy valiosas para los negocios. Actualmente existen procedimientos ambiguos para la realización de dicha tarea y sobre todo para textos en español y de manera específica para notas periodísticas y publicaciones realizadas en redes sociales, todo ello por el hecho de la escasa cantidad de herramientas existentes para la presente tarea, por ende el proceso de clasificación de las polaridades de los sentimientos expresadas en los textos se realiza de manera manual por expertos en el tema, generándose así resultados ambiguos y sesgados según la experiencia del encargado, lo cual generaba resultados que no eran del todo fiables retándole valor a dicha tarea, además del hecho de que realizarlo de manera totalmente manual resultaba muy pesado y se realizaba en un periodo largo de tiempo. Para la realización de dicha tarea existen múltiples técnicas de aprendizaje de máquina y de aprendizaje profundo que son adecuadas para este, pero en el último año uno de los modelos que va siendo reconocido cada vez más para ser aplicado a resolver problemas de procesamiento de lenguaje natural son los modelos basados en transformers dadas sus buenas capacidades y los resultados que se obtienen con estos. Ante dicha problemática surge la necesidad de investigar más acerca de cómo se vienen implementando soluciones para la realización de análisis de sentimiento para hacer una comparativa sobre los modelos usados y además dadas las buenas capacidades de los modelos basados en transformers investigar más a fondo la utilidad de estos y las aplicaciones que tiene para así comprobar sus buenas capacidades.Item Implementación de un algoritmo de aprendizaje profundo basado en eventos para el problema de predicción de movimiento bursátil(Pontificia Universidad Católica del Perú, 2021-11-30) Bustamante Arce, Jaime Diego; Beltrán Castañón, César ArmandoLa predicción de precios bursátiles, acciones e índices siempre ha sido un tema de interés en el mundo financiero, no solo por su capacidad de originar grandes rentabilidades en poco tiempo, sino también por su volatilidad y complejidad. Así, desde que los mercados bursátiles fueron concebidos diferentes investigadores en variadas áreas han tratado de “vencerlo” prediciendo su comportamiento, como el índice S&P 500 que lista la cotización de las 500 corporaciones más líquidas de la Bolsa de New York. Uno de los enfoques es el fundamentalista, que busca predecirlo de acuerdo a las noticias en los medios de las empresas listadas en la Bolsa de Valores. Desde el lado informático, diversas técnicas han venido siendo aplicadas para realizar esta predicción como estadísticas y las clásicas herramientas de aprendizaje de máquina. Sin embargo, con el creciente aumento de volumen de información, se hace necesario aplicar técnicas que consigan lidiar con esta información no estructurada. Técnicas como redes profundas recurrentes (LSTM), se han mostrado ad-hoc para el manejo de información temporal, debido a que tienen de capacidad de memorizar hechos pasados, que persisten en el tiempo. En el presente trabajo se propone una metodología y conjunto de redes neuronales profundas para la predicción de movimiento bursátil a partir de eventos y noticias corporativas. Para ello no solo se considera la contextualización de palabras, sino también sus relaciones y composición semántica, estructura e historia para la predicción del índice S&P 500. En resumen, el presente proyecto obtiene resultados exitosos puesto que sobrepasan a los del estado del arte. Así, el conjunto de modelos neuronales propuestos puede ser usados como apoyo en la decisión de inversión diaria en el índice S&P 500.Item Implementación de un sistema de recomendación basado en el análisis de polaridad y caracterización de revisiones de usuarios de un marketplace(Pontificia Universidad Católica del Perú, 2021-07-21) Pando Robles, Enrique André; Beltrán Castañón, César ArmandoEl crecimiento constante de Internet va de la mano con el rápido aumento del volumen de información, lo cual brinda una amplia gama de alternativas de compra al usuario, quien puede verse superado por la gran variedad de productos disponibles. A fin de ayudar en la elección de productos, se desarrollan los sistemas de recomendación, los cuales acotan los potenciales productos de agrado para el usuario. Con el fin de recabar mayor información, los sitios de comercio electrónico van añadiendo nuevas funcionalidades, tales como asignar una puntuación y comentarios sobre el producto adquirido. Este último expresa, en palabras del usuario, su sentimiento luego de realizar la compra, el cual podría ser un comentario positivo, negativo o neutro. Es así como surge la necesidad de poder analizar todos estos datos textuales, los cuales guardan una rica información sobre el parecer de los usuarios, pudiendo así ser utilizada para una potencial mejor toma de decisión a fin de mejorar el servicio de comercio. Sin embargo, para poder otorgar una recomendación al usuario, es necesario analizar a los demás que ya adquirieron productos similares, siendo importante detectar a aquellos compradores que tengan un patrón similar (por ejemplo, en sus comentarios) siendo este un problema que demanda estrategias de filtrado de estas características similares. Por lo tanto, el presente tema de tesis combina los sistemas de recomendación y el análisis de polaridad con el objetivo de brindar una recomendación de productos al usuario con base en las puntuaciones y comentarios (usando filtros colaborativos), de manera que el usuario pueda obtener una lista reducida de productos potenciales a adquirir con base en su histórico de compras. Teniendo como conclusión principal la comprobación estadística de que el sistema de recomendación propuesto es superior a solo usar las puntuaciones para recomendar.