Informática con mención en Ciencias de la Computación

Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/6357

Browse

Search Results

Now showing 1 - 5 of 5
  • Thumbnail Image
    Item
    Estimación del carbono almacenado en paisajes agropecuarios y ganaderos a partir de Imágenes multiespectrales capturadas por drones, y técnicas de aprendizaje profundo
    (Pontificia Universidad Católica del Perú, 2024-01-10) Tovar Galarreta, Juan Carlos Alfredo; Villanueva Talavera, Edwin Rafael
    Los paisajes agrícolas y ganaderos están estrechamente relacionados con el flujo de carbono, ya que actúan como reservorios de carbono en forma de biomasa. La evaluación de las reservas de carbono almacenadas en estas zonas es importante para apoyar la toma de decisiones que impidan que estas zonas se conviertan en fuentes de emisión de carbono. Sin embargo, las técnicas tradicionales de estimación de las reservas de carbono requieren un muestreo in situ, lo que supone una tarea extenuante, arriesgada, costosa DE escasa cobertura. En este estudio, proponemos una metodología, basada en imágenes multiespectrales capturadas por drones y modelos de aprendizaje profundo, para automatizar la tarea de estimar mapas de reservas de carbono almacenados en paisajes agrícolas y ganaderos. Aplicamos una arquitectura de red neuronal U-Net para discriminar las zonas arbóreas y pastizales. Luego, se desarrolla un modelo basado en redes neuronales convolucionales para la estimación de la densidad de carbono a partir de imágenes multiespectrales. Resultados experimentales en paisajes agrícolas y ganaderos de la Amazonía peruana mostraron la efectividad de la metodología propuesta, reportando un mIoU de 87%, un RMSE de 2.44 para zonas arbóreas, y un RMSE de 1.84 para zonas de pastura. Concluimos que la estimación de la densidad de carbono es alcanzable con el enfoque propuesto. Esta metodología puede ser útil para la toma de decisiones y puede contribuir a la gestión o al control del cambio climático.
  • Thumbnail Image
    Item
    Pronóstico del precio de cobre utilizando técnicas de aprendizaje profundo
    (Pontificia Universidad Católica del Perú, 2023-03-06) Carhuas Ñañez, Milton Cesar; Villanueva Talavera, Edwin Rafael
    Pronosticar los precios futuros de cobre es una tarea desafiante dadas las características dinámicas y no lineales de varios factores que afectan el precio del cobre. Este artículo describe modelos de pronóstico, basados en arquitecturas de redes neuronales, para predecir los retornos del precio de cobre en tres horizontes de tiempo: un día, una semana y un mes adelante. Diversas variables se consideran como variables de entrada, como los precios históricos de diferentes materias primas metálicas y variables macroeconómicas globales. Evaluamos los modelos con datos diarios de 2007 a 2020. Los resultados experimentales mostraron que los modelos de salida única presentan un mejor rendimiento predictivo que los modelos de salida múltiple. Las arquitecturas de mejor rendimiento fueron los modelos de memorias largas a corto plazo (LSTM) en datos de prueba.
  • Thumbnail Image
    Item
    Sobre la construcción de ensambles de clasificadores diversos en tanto que variación normalizada de información y su vínculo con su precisión
    (Pontificia Universidad Católica del Perú, 2021-11-07) Guinea Ordóñez, Rodrigo José; Villanueva Talavera, Edwin Rafael
    La hipótesis en cuestión afirma que, dado el contexto teórico (i.e., definiciones matemáticas consideradas apropiadas para describir los fenómenos que se pretende estudiar) descrito en el artículo, existe una relación entre diversidad global y precisión de un ensamble de clasificadores. Por lo tanto, el propósito de esta investigación es estudiar la relación entre la precisión de ensambles y su diversidad dentro de un contexto geométrico y de información. Para lograrlo, interpretamos el problema como uno geométrico introduciendo un espacio métrico, donde los puntos son predicciones de clasificadores; la función de distancia, la métrica Variación de Información Normalizada (NVI, por sus siglas en inglés); y la construcción de un ensamble diverso es reducida a un problema de criba y novedosamente transformado a uno de programación cuadrática. La significancia estadística es asegurada haciendo uso de métodos Monte Carlo sobre 53 conjuntos de datos apropiados. El resultado es un algoritmo basado en una métrica usada en el contexto de teoría de la información, ideal para estudiar conjuntos de datos de alta dimensionalidad e inherentemente ruidosos. Por tanto, es relevante cuando el costo de adquirir muestras es muy alto; y la cantidad de variables, enorme. El marco teórico incluye las definiciones (e.g., definiciones relacionadas al concepto de diversidad o al espacio métrico utilizado), los teoremas (e.g., propiedades de espacios métricos) y algoritmos base (i.e., programación cuadrática) usados para conseguir los resultados. Los resultados muestran que, en promedio, el exceso de precisión de un ensemble diverso respecto de su contraparte aleatoria es función del valor de la diversidad global del mismo. Esto confirma la hipótesis inicial. Además, la metodología introducida para modelar el algoritmo introduce un marco que permite esclarecer la relación entre diversidad y precisión, ya que la representa en términos geométricos.
  • Thumbnail Image
    Item
    Implementación de un modelo algorítmico para la estimación del nivel de concentración de contaminante PM2,5 en zonas urbana
    (Pontificia Universidad Católica del Perú, 2020-10-29) Vargas Campos, Irvin Rosendo; Villanueva Talavera, Edwin Rafael
    Según la Organización Mundial de la Salud (OMS), la mala calidad del aire provoca 1 de cada 10 muertes globalmente, 7 millones de personas fallecen al año debido a enfermedades causadas por la contaminación, además la mala calidad del aire es un factor contribuyente al cambio climático, específicamente al calentamiento global. En Perú, se debe cumplir los Estándares de Calidad Ambiental (ECAs) establecidos por el Ministerio del Ambiente y supervisados por el Organismo de Evaluación y Fiscalización Ambiental (OEFA); no obstante, cumplir esta tarea se ve dificultada por la baja cantidad de estaciones de medición. Debido a ello, el presente proyecto propone estudiar diferentes estrategias de ingeniería de características y modelos de aprendizaje de máquina que puedan estimar el nivel de contaminación de aire en zonas urbanas no censadas. Para ello, se usó datos de contaminantes y variables meteorológicas recolectados por una red de monitoreo en la ciudad de Beijing, China. Se obtuvo como resultado que el modelo Linear Regression entrenado con los datasets de contaminante PM2;5 de las 5 estaciones más cercanas al punto de predicción y normalizados mediante una adaptación de Inverse Distance Weighting presentó mejor capacidad de estimación. Por otro lado, los modelos LightGBM y XGBoost presentaron resultados un poco inferiores, pero eran más robustos, pues su capacidad de estimación se mantenía estable a pesar de la modificación de la cantidad de estaciones usadas para el entrenamiento de los modelos. Como trabajo futuro, se pretende usar y adaptar los modelos estudiados en esta investigación en las zonas urbanas de Lima, Perú.
  • Thumbnail Image
    Item
    Aplicación de redes bayesianas para modelamiento y predicción de calidad del aire en áreas urbana
    (Pontificia Universidad Católica del Perú, 2020-10-27) Cusi Chirapo, Hernán; Villanueva Talavera, Edwin Rafael
    La contaminación del aire es hoy en día uno de los mayores problemas en las grandes ciudades. Entender la dinámica de los contaminantes y determinar la calidad de aire en áreas no monitorizadas ha sido el objetivo de varias investigaciones recientes dada su relevancia en la creación de políticas de mitigación. Los enfoques propuestos se dividen principalmente en aquellos que intentan modelar la dinámica de emisión/difusión y en aquellos que intentan predecir la concentración de contaminantes en el espacio y/o tiempo. Comúnmente estos enfoques tienen fines diferentes, los primeros se enfocan en entender los mecanismos que expliquen la distribución histórica de contaminantes, mientras que los segundos se enfocan en crear modelos predictivos, sin importar si dichos modelos representan las causalidades de los procesos subyacentes. En la presente investigación se propone la aplicación de modelos de redes Bayesianas, las cuales pueden tanto capturar posibles causalidades del proceso de formación y difusión de contaminación, así como servir de modelos algorítmicos para inferir en el espacio y en el tiempo los parámetros de calidad del aire. Se aplicó la técnica de bootstraping junto con técnicas de aprendizaje estructural para aprender diversos modelos bayesianos e integrarlos en un modelo robusto en el cual se puede discriminar relaciones fuertes entre las variables de calidad del aire de posibles relaciones espurias. En un primer experimento se creó modelos para predecir un determinado tipo de contaminante en un punto en el espacio, dada las mediciones de una red de estaciones del mismo tipo de contaminante. En un segundo experimento se adicionó varios tipos de contaminantes para hacer dicha predicción. En un tercer experimento se aprendió modelos adicionando dos variables metereológicas comúnmente usadas para el modelado de calidad del aire: velocidad y dirección del viento. En un cuarto experimento se aprendió modelos suministrando conocimiento a priori aprendido en el primer experimento a fin de reducir costo computacional de aprendizaje e inferencia. En total, se aprendieron 504 modelos, identificándose 6 modelos en el ultimo experimento con capacidades predictivas significativas a costos computacionales razonables. Como ventaja del modelado se pudo identificar las distancias de influencia de la red de estaciones que incide directamente en la predicción espacial, ayudando así a entender la dinámica de difusión de los diferentes tipos de contaminantes.