Facultad de Ciencias e Ingeniería

Permanent URI for this communityhttp://98.81.228.127/handle/20.500.12404/7

Browse

Search Results

Now showing 1 - 5 of 5
  • Item
    Modelo de red neuronal convolucional para la clasificación de tipos de nubes en imágenes de webcam
    (Pontificia Universidad Católica del Perú, 2025-01-14) Andonaire Tuesta, Mario Alejandro; Beltrán Castañón, César Armando; Villanueva Talavera, Edwin Rafael
    La presente investigación aborda la problemática de la clasificación manual de tipos de nubes en estaciones meteorológicas del Servicio Nacional de Meteorología e Hidrología del Perú (SENAMHI), un proceso sujeto a errores y demandante de tiempo. El estudio justifica su relevancia destacando la importancia de la observación precisa de nubes en la meteorología y cómo la automatización mediante una herramienta de clasificación basada en redes neuronales convolucionales podría optimizar este procedimiento. Este trabajo se enmarca dentro del proyecto Meteo-Huascarán, en colaboración con el SENAMHI y el grupo de investigación IAPUCP. El método empleado consiste en el entrenamiento de un modelo de red neuronal convolucional, utilizando aprendizaje supervisado para clasificar automáticamente los tipos de nubes a partir de imágenes tomadas desde tierra. La investigación contempla la preparación de una base de datos representativa, la implementación de tres arquitecturas de redes neuronales y la selección de la más adecuada mediante una evaluación comparativa. Además, el desarrollo una interfaz web para mostrar el funcionamiento del modelo. Los resultados muestran un avance en la automatización de la clasificación de tipos de nubes, seleccionando la arquitectura Inception v3 como la más adecuada para el proyecto. La implementación de la interfaz web facilita la interacción con el modelo, permitiendo la carga de imágenes de nubes y obteniendo la clasificación correspondiente de forma automática. Este trabajo contribuye a la automatización del proceso de clasificación de tipos de nubes en el SENAMHI, proponiendo una solución tecnológica que reduce la dependencia de observadores humanos y mejora la eficiencia y precisión en la observación meteorológica. La implementación de este modelo representa un paso adelante hacia la modernización y adaptación a las necesidades futuras en el campo de la meteorología en el Perú.
  • Thumbnail Image
    Item
    Análisis de clustering de secuencias genómicas de SARS-COV-2 identificadas en Perú
    (Pontificia Universidad Católica del Perú, 2023-11-02) Mejia Mujica, Carolina Estefania; Villanueva Talavera, Edwin Rafael
    El presente proyecto de tesis tiene como objetivo el desarrollo de una herramienta analítica interactiva para representar visualmente la diversidad de las secuencias genómicas de SARS-CoV-2 en el Perú, que facilite el análisis de agrupamientos en el espacio y tiempo; y, que permita incorporar nuevas secuencias. Este trabajo pretende resolver la necesidad de realizar una analítica avanzada que incluya representaciones de agrupamiento en el espacio y tiempo de la diversidad de las secuencias genómicas de SARS-CoV-2 en el Perú con el fin de apoyar la vigilancia genómica. Esta investigación surge debido a la pandemia y al virus que evoluciona aceleradamente presentando constantes variantes genómicas, por lo que, la comunidad académica y autoridades sanitarias están interesados en entender la diversidad de estas para así realizar más estudios sobre su propagación. En el caso del Perú, de acuerdo a la revisión bibliográfica, no se encontraron estudios publicados que investiguen la distribución de las variantes del virus SARS-CoV-2. Comprender esta dinámica es importante porque ayudará a conocer el impacto de la pandemia en el país, además de tener un mejor conocimiento de la propagación del virus SARS-CoV-2 para que las autoridades sanitarias tomen acciones informadas. Por ello, los objetivos planteados son el desarrollo de un módulo de software que permita realizar una representación visual espacio-temporal de las secuencias genómicas SARS-CoV- 2; el desarrollo de un módulo de software que permita realizar un análisis de agrupamiento de las secuencias genómicas SARS-CoV-2 con la capacidad de incorporar nuevas secuencias; y la implementación de vistas con capacidades interactivas en ambos módulos para que el usuario interactúe con ellos. Finalmente, la herramienta desarrollada cumple con realizar un análisis de agrupamiento y una representación visual en el espacio-tiempo de la diversidad de secuencias genómicas SARS-CoV-2 para apoyar la vigilancia genómica en el Perú.
  • Thumbnail Image
    Item
    Desarrollo de un pipeline bioinformático que permite el ensamblaje y la anotación del genoma de la bacteria rickettsia asembonensis
    (Pontificia Universidad Católica del Perú, 2022-04-19) Arauco Alarcon, Ronie Paolo; Villanueva Talavera, Edwin Rafael
    En las últimas décadas, el surgimiento y resurgimiento de las bacterias infecciosas se han convertido en amenazas de importancia para la salud pública. Este es el caso de la bacteria de la especie Rickettsia asembonensis -identificada en Asembo, Kenia- que, en los últimos años, ha sido detectada en pulgas (Ctenocephalides felis y Ctenocephalides canis), en regiones anteriormente no reportadas y en casos de síndromes febriles agudos inespecíficos. Este patógeno emergente -así como muchos otros- sigue siendo relativamente desconocido. Por lo que, se convierte en una necesidad sustancial no subestimarlo y expandir su estudio no solo epidemiológico, sino también relacionado a su biología molecular. En la actualidad, el esfuerzo científico a fin de incrementar la eficiencia de la obtención de la biología molecular de las especies a nivel global ha generado la aparición de tecnologías de secuenciación de última generación. En ese sentido, la gran cantidad de datos genómicos deben ser manipulados con técnicas bioinformáticas. Estas últimas, han permitido un mejor entendimiento y uso de los datos que generan las tecnologías de secuenciación. Siendo que, recientemente, la aplicación de protocolos y pipelines ha generado resultados favorables. En consecuencia, la aplicación de técnicas bioinformáticas con la finalidad de obtener la información genómica de la bacteria R. asembonensis representa una oportunidad para contribuir al conocimiento científico de este microorganismo. Por lo tanto, el presente trabajo tiene como objetivo principal el ensamblaje y la anotación del genoma de la bacteria R. asembonensis a través de un pipeline bioinformático, que hará uso de datos secuenciados de la pulga de la especie C. felis positivas para R. asembonensis, a partir de unas muestras recolectadas en un estudio llevado a cabo en la ciudad de Iquitos. El presente trabajo generará también un precedente y referente metodológico para otras especies de interés con la misma problemática.
  • Thumbnail Image
    Item
    Aplicación de aprendizaje profundo para la detección y clasificación automática de insectos agrícolas en trampas pegantes
    (Pontificia Universidad Católica del Perú, 2021-09-30) Córdova Pérez, Claudia Sofía; Villanueva Talavera, Edwin Rafael
    La horticultura es una actividad que da trabajo a muchos peruanos en distintas zonas del país, sin embargo, gran parte de la producción de hortalizas es dañada por la alta incidencia de plagas de insectos. En la actualidad, un método efectivo para realizar el control de estas plagas es el uso de trampas pegantes, las cuales atraen y atrapan distintos tipos de insectos. Convencionalmente, las trampas pegantes son colocadas de forma que queden distanciadas uniformemente en el campo donde se realiza el cultivo y luego de varios días se realizan observaciones visuales por parte del personal entrenado en reconocimiento de insectos. No obstante, la información recopilada manualmente por el humano puede no ser tan exacta, pues existen diversos factores que pueden influir en la precisión de esta, por ejemplo, la habilidad de cada persona para detectar distintos tipos de insectos y la posible fatiga que puede ser consecuencia de haber realizado un trabajo manual por mucho tiempo y para una muestra grande de insectos. Las soluciones que se encontraron en la revisión sistemática para tratar problemas de detección de insectos fueron algoritmos de segmentación con cambio de espacio de color, lo cual permite remover el fondo de una imagen y centrarse únicamente en el objeto de interés; también, se encontraron estudios que usaron modelos de detección, los cuales hacen uso de aprendizaje profundo con redes neuronales convolucionales para lograr la identificación de los insectos. Esta última técnica ha dado resultados óptimos en distintos problemas visión computacional, por lo que el presente proyecto de investigación propone usar los modelos de detección pre-entrenados Faster R-CNN y YOLOv4 y aplicarles aprendizaje por transferencia para ajustarlos al problema de detección de tres tipos de plagas de insectos: la mosca blanca, la mosca minadora y el pulgón verde del melocotonero en etapa de adulto alado. Para ello, se debe contar con un corpus de imágenes de trampas pegantes con insectos plaga y, debido a la limitada disponibilidad de estas, se planteó construir un generador de imágenes realistas de trampas pegantes con insectos, el cual tiene en consideración factores realistas como la iluminación y el nivel de ruido en las imágenes, además, se usaron técnicas de segmentación y aumento de imágenes de modo que el corpus obtenido sea el adecuado para la fase de entrenamiento. Finalmente, se midió la métrica mAP de ambos modelos para los tres tipos de insectos. El modelo Faster R-CNN obtuvo 94.06% y el modelo YOLOv4, 95.82%, donde se concluye que el desempeño de ambos detectores es aceptable.
  • Thumbnail Image
    Item
    Inferencia de interacciones causales génicas usando técnicas basadas en Manto de Markov
    (Pontificia Universidad Católica del Perú, 2019-10-23) Del Río Cárdenas, Sergio Andrés; Villanueva Talavera, Edwin Rafael
    Conocer cómo interactúan los genes en las células es un objetivo importante en biología y medicina. Este conocimiento permitiría la creación de terapias celulares precisas para corregir disfunciones de los mecanismos moleculares detrás de condiciones patológicas como el cáncer [1,2]. El estudio de estas interacciones ha sido realizado tradicionalmente por medio de experimentos que involucran perturbaciones a los sistemas celulares, y con ello una alta demanda de tiempo y mano de obra. La premisa común para realizar estos costosos experimentos de intervención es que ellos permiten detectar relaciones de causalidad entre genes sin ambigüedad, a diferencia de realizar únicamente observaciones en los sistemas celulares que no permitirían distinguir de forma confiable relaciones causales de correlaciones estadísticas generadas indirectamente por mecanismos no observados. En redes génicas, es necesario distinguir entre una causa de un efecto y el efecto de una causa, ya que esto permitiría saber cómo funciona la regulación génica en las células. No obstante, Maathius et al. [6] demostró que inferir relaciones causales en redes moleculares es posible usando datos de observaciones de los componentes del sistema (genes) y una metodología de análisis de datos. Estos trabajos generaron interés en el tema motivando diversos trabajos en consecuencia con el enfoque de estadística inferencial y causalidad. Sin embargo, las metodologías propuestas incorporan fuertes consideraciones en los modelos, como aciclicidad de las interacciones y gausianidad en los niveles de expresión de los genes, consideraciones que son biológicamente cuestionables, así como un elevado costo computacional para su procesamiento. Es en dicho contexto donde el presente proyecto propone aplicar un enfoque basado en Aprendizaje Máquina (AM). Este campo estudia cómo generar modelos que aprendan a discriminar objetos o instancias en categorías o clases conocidas, con base a un conjunto de instancias ya clasificadas (datos de entrenamiento). La idea de usar Aprendizaje Máquina en la detección de interacciones causales entre genes es aprender las diferencias mínimas que puedan existir dentro de las observaciones temporales de las expresiones de los genes que pueden caracterizar comportamientos causales entre genes. Sin embargo, al aplicar Aprendizaje Máquina en problemas de alta dimensionalidad como el descrito, es común hallar un alto costo computacional para su ejecución, lo cual genera la necesidad de métodos de reducción de dimensionalidad. En el presente proyecto se propone investigar un enfoque basado en el concepto de Manto de Markov (MM), cuyos estimadores han probado ser teóricamente óptimos para la detección del conjunto de variables causalmente relevante respecto a una variable de interés.