Informática
Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/765
Browse
6 results
Search Results
Item Detección de ciberbullying en español para el dominio de corpus de texto teatrales aplicado a redes sociales usando transferencia de aprendizaje y validación adversarial(Pontificia Universidad Católica del Perú, 2024-11-20) Marquez Zavaleta, Esli Samuel; Gómez Montoya, Héctor ErasmoEl aprendizaje de los modelos de detección de ciberbullying en redes sociales depende significativamente del conjunto de datos en cual fue entrenado lo que puede limitar su capacidad de generalización a otros conjuntos de datos. Este estudio propone un enfoque innovador utilizando transferencia de aprendizaje. Se desarrolló un modelo robusto de detección de ciberbullying basado en guiones teatrales, que ofrecen contextos ricos y variados. Para ello, se creó un corpus en español a partir de estos guiones, el cual fue meticulosamente etiquetado por expertos. Posteriormente, el modelo fue entrenado con este corpus para establecer una base de conocimiento que se aplicó luego a otros corpus de redes sociales. Los resultados mostraron una exactitud del 83% en las pruebas realizadas. Complementamos dicho modelo con una validación utilizando ejemplos adversarios, a partir de técnicas de data aumentada generamos más oraciones para fortalecer su capacidad de generalización, mejorando su desempeño tanto en su corpus como en distintos dominios de ciberbullying.Item Reconocimiento de texto en manuscritos históricos peruanos utilizando modelos mixtos(Pontificia Universidad Católica del Perú, 2024-10-31) Tarazona Cruz, Luz Silvana; Fonseca Arroyo, Pablo AlejandroEl presente trabajo de investigación aborda la tarea del reconocimiento automático de texto escrito a mano (handwritten text recognition - HTR, por sus siglas en inglés) en los manuscritos históricos de autores peruanos, que están bajo la custodia de la Biblioteca Nacional del Perú (BNP), enfrentando diversas dificultades como la variabilidad caligráfica, el deterioro del papel, entre otras. Para esta tarea, se emplearon modelos de reconocimiento de imágenes preentrenados en otros idiomas disponibles en la plataforma de código abierto denominado OCR4all. Se entrenaron tres modelos utilizando el conjunto de datos SPA-Sentences, conjunto que consta de imágenes y traducciones de aproximadamente 13,000 oraciones en idioma español, logrando una tasa de error de caracteres (character error rate - CER) promedio de 4.11% en el conjunto de validación. Posteriormente, este modelo elaborado se aplica en los manuscritos históricos peruanos, obteniendo una tasa de error promedio de 9.39%. El CER obtenido, ligeramente menor en comparación con el conjunto de datos SPA-Sentences utilizado en la etapa de entrenamiento, es atribuible a las diferencias en la calidad de las imágenes, así como en las características propias de los manuscritos. Este trabajo y el enfoque desarrollado en él demuestran la utilidad de los modelos de reconocimiento de imágenes preentrenados para abordar la tarea de HTR en manuscritos históricos, y se identifican áreas para futuras mejoras, como la optimización de la calidad de las imágenes, la diversidad del conjunto de datos y la exploración de modelos avanzados con la arquitectura Transformer.Item Systematic mapping of software engineering management with an agile approach(Pontificia Universidad Católica del Perú, 2024-01-10) Mautino Rubio, David Brando; Nina Hanco, HernanEl enfoque ágil ha generado una amplia variedad de estrategias para administrar con éxito diversos proyectos de software en todo el mundo. Además, podemos asegurar que los proyectos de software se han beneficiado de los métodos ágiles ya conocidos. En este sentido, este artículo busca demostrar cómo se aplica el enfoque ágil en las áreas de la gestión en la ingeniería del Software. Para ello, este estudio realiza un mapeo sistemático para identificar las principales tendencias en la gestión de la ingeniería de software con un enfoque ágil. Se han identificado un total de 1137 artículos, de los cuales 165 son relevantes para los fines de este estudio, estos indican que la entrega temprana de valor, un principio clave de la agilidad, sigue siendo la principal tendencia para el uso de métodos ágiles. Sin embargo, también existen fuertes tendencias enfocadas en puntos clave de la gestión en ingeniería de software, como optimizar la gestión de calidad, optimizar la especificación de requisitos, optimizar la gestión de riesgos y mejorar la comunicación y coordinación del equipo, estos resultados permitirán generar nuevas líneas de investigación para cada punto clave de la gestión en la ingeniería del software impactado por el enfoque ágil.Item Herramienta integrada para la curación de proteínas repetidas(Pontificia Universidad Católica del Perú, 2023-07-20) Bezerra Brandao Corrales, Manuel Alberto; Hirsh Martinez, LaylaA finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y presentan un rol crítico en procesos biológicos como la comunicación celular y el reconocimiento molecular (Brunette et al., 2015; Marcotte et al., 1999). Existe un creciente interés en el estudio de las proteínas repetidas debido a sus pliegues estructurales estables, una alta conversación evolutiva y un amplio repertorio de funciones biológicas (Chakrabarty & Parekh, 2022). Además, se estima que una de cada tres proteínas humanas son consideradas repetidas (Jorda & Kajava, 2010). La identificación, clasificación y curación de regiones de repetición en proteínas es un proceso complejo que requiere del procesamiento manual de expertos, gran capacidad computacional y tiempo. Existen diversos avances recientes y relevantes que aplican modelos de aprendizaje automático para la predicción de estructura tridimensional de proteínas y la predicción de clasificación de proteínas repetidas. Este tipo de aplicaciones resultan útiles para este proceso de curación. No obstante, a pesar de que este tipo de software son de libre acceso y de código abierto, no se cuenta con un servicio integrado que contemple las herramientas y bases de datos que soporten la investigación en proteínas repetidas. Por estos motivos, en este proyecto de investigación de plantea, diseña y desarrolla un servicio web integrado para la curación de proteínas repetidas. Con este objetivo, se ha considerado la integración con la base de datos de estructuras terciarias del Protein Data Bank (PDB) y la base de datos de predicciones de estructuras tridimensionales AlphaFold. Asimismo, se ha utilizado un modelo de redes neuronales que permite predecir la probabilidad de clasificación en cada clase de proteína repetida. Finalmente, con esta predicción, se implementó una mejora al algoritmo ReUPred para volver más eficiente el proceso de identificación de regiones y unidades de repetición. Este servicio ha sido desplegado utilizando computación en la nube en la página bioinformática.org de la cual es parte el laboratorio de investigación en Bioinformática de la Pontificia Universidad Católica del Perú. Este servicio permite que los investigadores no requieran contar con alta capacidad de procesamiento computacional para el proceso de curación de proteínas repetidas e integra los resultados totales obtenidos.Item Revisión sistemática de la literatura técnicas de diseño para la usabilidad en el contexto del M-commerce(Pontificia Universidad Católica del Perú, 2021-05-11) Monzón Seminario, Israel Alfonso; Dávila Ramón, Abraham EliseoAntecedentes: El intensivo uso de los dispositivos móviles en todo el mundo, ha generado un nuevo escenario para el comercio electrónico denominado m-Commerce, el cual presenta características particulares por la propia naturaleza de estos tipos de dispositivos. En este contexto, la usabilidad se ha convertido en un elemento clave, pues el tamaño de los dispositivos introduce restricciones a los diseñadores de aplicaciones y esto puede determinar la aceptación o rechazo del software. Objetivo: Analizar de manera comparada las distintas técnicas para el diseño de interfaces de usuario que proveen un alto nivel de usabilidad en las aplicaciones móviles. Método: El método utilizado fue el de la revisión sistemática de la literatura en las bases de datos más reconocidas. Resultados: Se identificaron 20 estudios los cuales hacen referencia a 13 técnicas, 5 enfoques y 2 métodos que pueden ser utilizados para el diseño de pantallas de alta usabilidad. Conclusiones: Se puede concluir que existen diferentes técnicas de diseño que pueden ser usadas en el comercio móvil o para cualquier otro campo del e-Business, con el fin de mejorar la usabilidad de las interfaces de usuario en los dispositivos móviles.Item Talking with signs: a simple method to detect nouns and numbers in a non annotated signs language corpus(Pontificia Universidad Católica del Perú, 2020-08-31) Huiza Pereyra, Eric Raphael; Olivares Poggi, Cesar AugustoPeople with deafness or hearing disabilities who aim to use computer based systems rely on state-of-art video classification and human action recognition techniques that combine traditional movement pat-tern recognition and deep learning techniques. In this work we present a pipeline for semi-automatic video annotation applied to a non-annotated Peru-vian Signs Language (PSL) corpus along with a novel method for a progressive detection of PSL elements (nSDm). We produced a set of video annotations in-dicating signs appearances for a small set of nouns and numbers along with a labeled PSL dataset (PSL dataset). A model obtained after ensemble a 2D CNN trained with movement patterns extracted from the PSL dataset using Lucas Kanade Opticalflow, and a RNN with LSTM cells trained with raw RGB frames extracted from the PSL dataset reporting state-of-art results over the PSL dataset on signs classification tasks in terms of AUC, Precision and Recall.