Informática
Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/765
Browse
17 results
Search Results
Item Detección de ciberbullying en español para el dominio de corpus de texto teatrales aplicado a redes sociales usando transferencia de aprendizaje y validación adversarial(Pontificia Universidad Católica del Perú, 2024-11-20) Marquez Zavaleta, Esli Samuel; Gómez Montoya, Héctor ErasmoEl aprendizaje de los modelos de detección de ciberbullying en redes sociales depende significativamente del conjunto de datos en cual fue entrenado lo que puede limitar su capacidad de generalización a otros conjuntos de datos. Este estudio propone un enfoque innovador utilizando transferencia de aprendizaje. Se desarrolló un modelo robusto de detección de ciberbullying basado en guiones teatrales, que ofrecen contextos ricos y variados. Para ello, se creó un corpus en español a partir de estos guiones, el cual fue meticulosamente etiquetado por expertos. Posteriormente, el modelo fue entrenado con este corpus para establecer una base de conocimiento que se aplicó luego a otros corpus de redes sociales. Los resultados mostraron una exactitud del 83% en las pruebas realizadas. Complementamos dicho modelo con una validación utilizando ejemplos adversarios, a partir de técnicas de data aumentada generamos más oraciones para fortalecer su capacidad de generalización, mejorando su desempeño tanto en su corpus como en distintos dominios de ciberbullying.Item Reconocimiento de texto en manuscritos históricos peruanos utilizando modelos mixtos(Pontificia Universidad Católica del Perú, 2024-10-31) Tarazona Cruz, Luz Silvana; Fonseca Arroyo, Pablo AlejandroEl presente trabajo de investigación aborda la tarea del reconocimiento automático de texto escrito a mano (handwritten text recognition - HTR, por sus siglas en inglés) en los manuscritos históricos de autores peruanos, que están bajo la custodia de la Biblioteca Nacional del Perú (BNP), enfrentando diversas dificultades como la variabilidad caligráfica, el deterioro del papel, entre otras. Para esta tarea, se emplearon modelos de reconocimiento de imágenes preentrenados en otros idiomas disponibles en la plataforma de código abierto denominado OCR4all. Se entrenaron tres modelos utilizando el conjunto de datos SPA-Sentences, conjunto que consta de imágenes y traducciones de aproximadamente 13,000 oraciones en idioma español, logrando una tasa de error de caracteres (character error rate - CER) promedio de 4.11% en el conjunto de validación. Posteriormente, este modelo elaborado se aplica en los manuscritos históricos peruanos, obteniendo una tasa de error promedio de 9.39%. El CER obtenido, ligeramente menor en comparación con el conjunto de datos SPA-Sentences utilizado en la etapa de entrenamiento, es atribuible a las diferencias en la calidad de las imágenes, así como en las características propias de los manuscritos. Este trabajo y el enfoque desarrollado en él demuestran la utilidad de los modelos de reconocimiento de imágenes preentrenados para abordar la tarea de HTR en manuscritos históricos, y se identifican áreas para futuras mejoras, como la optimización de la calidad de las imágenes, la diversidad del conjunto de datos y la exploración de modelos avanzados con la arquitectura Transformer.Item Systematic mapping of software engineering management with an agile approach(Pontificia Universidad Católica del Perú, 2024-01-10) Mautino Rubio, David Brando; Nina Hanco, HernanEl enfoque ágil ha generado una amplia variedad de estrategias para administrar con éxito diversos proyectos de software en todo el mundo. Además, podemos asegurar que los proyectos de software se han beneficiado de los métodos ágiles ya conocidos. En este sentido, este artículo busca demostrar cómo se aplica el enfoque ágil en las áreas de la gestión en la ingeniería del Software. Para ello, este estudio realiza un mapeo sistemático para identificar las principales tendencias en la gestión de la ingeniería de software con un enfoque ágil. Se han identificado un total de 1137 artículos, de los cuales 165 son relevantes para los fines de este estudio, estos indican que la entrega temprana de valor, un principio clave de la agilidad, sigue siendo la principal tendencia para el uso de métodos ágiles. Sin embargo, también existen fuertes tendencias enfocadas en puntos clave de la gestión en ingeniería de software, como optimizar la gestión de calidad, optimizar la especificación de requisitos, optimizar la gestión de riesgos y mejorar la comunicación y coordinación del equipo, estos resultados permitirán generar nuevas líneas de investigación para cada punto clave de la gestión en la ingeniería del software impactado por el enfoque ágil.Item Herramienta integrada para la curación de proteínas repetidas(Pontificia Universidad Católica del Perú, 2023-07-20) Bezerra Brandao Corrales, Manuel Alberto; Hirsh Martinez, LaylaA finales de los años 1990, se identificó un conjunto de proteínas caracterizadas por tener patrones repetidos en su secuencia, lo que produce una estructura tridimensional repetitiva (Marcotte et al., 1999). Se han clasificado al menos 14% de proteínas encontradas en la naturaleza como repetidas, y presentan un rol crítico en procesos biológicos como la comunicación celular y el reconocimiento molecular (Brunette et al., 2015; Marcotte et al., 1999). Existe un creciente interés en el estudio de las proteínas repetidas debido a sus pliegues estructurales estables, una alta conversación evolutiva y un amplio repertorio de funciones biológicas (Chakrabarty & Parekh, 2022). Además, se estima que una de cada tres proteínas humanas son consideradas repetidas (Jorda & Kajava, 2010). La identificación, clasificación y curación de regiones de repetición en proteínas es un proceso complejo que requiere del procesamiento manual de expertos, gran capacidad computacional y tiempo. Existen diversos avances recientes y relevantes que aplican modelos de aprendizaje automático para la predicción de estructura tridimensional de proteínas y la predicción de clasificación de proteínas repetidas. Este tipo de aplicaciones resultan útiles para este proceso de curación. No obstante, a pesar de que este tipo de software son de libre acceso y de código abierto, no se cuenta con un servicio integrado que contemple las herramientas y bases de datos que soporten la investigación en proteínas repetidas. Por estos motivos, en este proyecto de investigación de plantea, diseña y desarrolla un servicio web integrado para la curación de proteínas repetidas. Con este objetivo, se ha considerado la integración con la base de datos de estructuras terciarias del Protein Data Bank (PDB) y la base de datos de predicciones de estructuras tridimensionales AlphaFold. Asimismo, se ha utilizado un modelo de redes neuronales que permite predecir la probabilidad de clasificación en cada clase de proteína repetida. Finalmente, con esta predicción, se implementó una mejora al algoritmo ReUPred para volver más eficiente el proceso de identificación de regiones y unidades de repetición. Este servicio ha sido desplegado utilizando computación en la nube en la página bioinformática.org de la cual es parte el laboratorio de investigación en Bioinformática de la Pontificia Universidad Católica del Perú. Este servicio permite que los investigadores no requieran contar con alta capacidad de procesamiento computacional para el proceso de curación de proteínas repetidas e integra los resultados totales obtenidos.Item Revisión sistemática de la literatura técnicas de diseño para la usabilidad en el contexto del M-commerce(Pontificia Universidad Católica del Perú, 2021-05-11) Monzón Seminario, Israel Alfonso; Dávila Ramón, Abraham EliseoAntecedentes: El intensivo uso de los dispositivos móviles en todo el mundo, ha generado un nuevo escenario para el comercio electrónico denominado m-Commerce, el cual presenta características particulares por la propia naturaleza de estos tipos de dispositivos. En este contexto, la usabilidad se ha convertido en un elemento clave, pues el tamaño de los dispositivos introduce restricciones a los diseñadores de aplicaciones y esto puede determinar la aceptación o rechazo del software. Objetivo: Analizar de manera comparada las distintas técnicas para el diseño de interfaces de usuario que proveen un alto nivel de usabilidad en las aplicaciones móviles. Método: El método utilizado fue el de la revisión sistemática de la literatura en las bases de datos más reconocidas. Resultados: Se identificaron 20 estudios los cuales hacen referencia a 13 técnicas, 5 enfoques y 2 métodos que pueden ser utilizados para el diseño de pantallas de alta usabilidad. Conclusiones: Se puede concluir que existen diferentes técnicas de diseño que pueden ser usadas en el comercio móvil o para cualquier otro campo del e-Business, con el fin de mejorar la usabilidad de las interfaces de usuario en los dispositivos móviles.Item Talking with signs: a simple method to detect nouns and numbers in a non annotated signs language corpus(Pontificia Universidad Católica del Perú, 2020-08-31) Huiza Pereyra, Eric Raphael; Olivares Poggi, Cesar AugustoPeople with deafness or hearing disabilities who aim to use computer based systems rely on state-of-art video classification and human action recognition techniques that combine traditional movement pat-tern recognition and deep learning techniques. In this work we present a pipeline for semi-automatic video annotation applied to a non-annotated Peru-vian Signs Language (PSL) corpus along with a novel method for a progressive detection of PSL elements (nSDm). We produced a set of video annotations in-dicating signs appearances for a small set of nouns and numbers along with a labeled PSL dataset (PSL dataset). A model obtained after ensemble a 2D CNN trained with movement patterns extracted from the PSL dataset using Lucas Kanade Opticalflow, and a RNN with LSTM cells trained with raw RGB frames extracted from the PSL dataset reporting state-of-art results over the PSL dataset on signs classification tasks in terms of AUC, Precision and Recall.Item ExpertTI : an knowledge system for intelligent service desks using free text(Pontificia Universidad Católica del Perú, 2017-04-17) Bello Ruiz, Alejandro Toribio; Melgar, Andrés; Pizarro, Daniel; Melgar Sasieta, Héctor AndrésWhen many users consult service desks simultaneously, these typically saturate. This causes the customer attention is delayed more than usual. The service is perceived as lousy from the point of view of the customer. Increase the amount of human agents is a costly process for organizations. In addition, the amount of sta turnover in this type of service is very high, which means make frequent training. All this has motivated the design of a knowledge-based system that automatically assists both customers and human agents at the service desk. Web technology was used to enable clients to communicate with a software agent via chat. Techniques of Natural Language Processing were used in order the software agent understands the customer requests. The domain knowledge used by the software agent to understand customer requests has been codi ed in an ontology. A rule-based expert system was designed to perform the diagnostic task. This paper presents a knowledge-based system allowing client to communicate with the service desk through a chat system using free text. A software agent automatically executes the customer request. The agent software attempts to reach a conclusion using expert system and ontology. If achieved success, returns the response to the customer, otherwise the request is redirected to a human agent. Evaluations conducted with users have shown an improvement in the attention of service desks when the software developed is used. On the other hand, since the most frequent requests are handled automatically, the workload of human agents decreases considerably. The software has also been used to train new human agents which facilitates and reduces the cost of training.Item Implementación de un algoritmo de grilla móvil para la simulación de reacciones autocatalíticas(Pontificia Universidad Católica del Perú, 2016-11-29) Mancilla Aguilar, César Hilario; Beltrán Castañón, César ArmandoEn este trabajo se presenta el diseño e implementación de una grilla (ventana multidimensional) móvil para aproximar numéricamente la solución de la ecuación de Fisher-Kolmogorov (FK), aplicada al modelamiento de frentes de reacciones autocatalíticas de reacción-difusión-advección. Nos apoyaremos en la perspectiva de la físico-química, el análisis numérico y su implementación en computador. Explicaremos concretamente en qué consisten las reacciones autocatalíticas y la importancia del estudio de los frentes de onda en dichas reacciones. Precisamos los fenómenos de reacción-difusión, mencionando los principales valores conocidos de velocidad de los frentes de onda, cuando no existe flujo externo. Mencionamos la dinámica de los sistemas de reacción-difusión-advección, con velocidades externas pequeñas (número de Peclet pequeño ( )), haciendo énfasis en el fenómeno de la dispersión hidrodinámica de Taylor y algunas aproximaciones asociadas. En cuanto al análisis numérico, utilizamos el método de diferencias finitas para aproximar las ecuaciones diferenciales mencionadas anteriormente, convirtiéndolas en relaciones algebraicas, utilizando el método Forward-Time Centered-Space (FTCS), mencionando los criterios de convergencia y estabilidad necesarios. Con ello, formulamos y sustentamos un algoritmo de grilla móvil, implementándolo en Fortran. Con el algoritmo implementado en Fortran, simulamos los frentes de onda, sin advección y con advección, comparando los valores teóricos de velocidades de frentes de onda, con los valores simulados. Al obtener una similitud razonable entre los valores de velocidad de los frentes de onda, para reacciones de orden dos (cuadráticas) y tres (cúbicas), procedimos a realizar predicciones sobre las velocidades de los frentes para reacciones de orden superior, cuatro y cinco. Durante las simulaciones por computadora, hemos conseguido mejorar el procesamiento de datos utilizando procesamiento paralelo y operaciones de bloques de memoria, adaptando nuestras estructuras de datos a la jerarquía de memoria cache del CPU utilizado. El algoritmo de grilla móvil implementado, con su estrategia de procesamiento y adaptación de estructuras de datos, puede ser adaptado fácilmente para estudiar otros fenómenos que admiten un esquema explícito para ser simulados.Item Caso de estudio : desarrollo de una aplicación móvil para Android para la medición del nivel de ruido integrando metodologías ágiles y técnicas de usabilidad(Pontificia Universidad Católica del Perú, 2016-04-02) Victoria Dionicio, Daniel; Zapata del Río, Claudia María del PilarLa usabilidad y las metodologías ágiles son dos enfoques orientados al usuario que contribuyen a mejorar el producto desarrollado, pero existen ciertas tensiones para integrarlos como parte de un mismo proceso. En esta tesis, se observa, a través de un caso de estudio, la forma de integrar las prácticas de usabilidad dentro de la metodología ágil más usada, Scrum, en el contexto del desarrollo de una aplicación para medir el ruido. Los resultados del estudio indican que prácticas de usabilidad como el prototipado, encuestas y evaluaciones heurísticas se pueden integrar como tareas dentro de las iteraciones de Scrum mientras que las pruebas de usabilidad deben ser un proceso separado posterior a la ejecución de cada iteración. Asimismo, se observa que la integración de técnicas de usabilidad a lo largo de las iteraciones contribuye con la reducción de la gravedad de los problemas de usabilidad.Item Aplicación práctica de técnicas para la estimulación y planificación de proyectos de software - TUPUY(Pontificia Universidad Católica del Perú, 2016-02-23) Inca Chiroque, Magaly; Pow Sang Portillo, José AntonioEl presente trabajo tiene por finalidad determinar la confiabilidad de la técnica Tupuy propuesta por el Dr. Pow Sang (Pow Sang Portillo, 2012), que mide el esfuerzo de un proyecto de software orientado a objetos con ciclo de vida incremental en su desarrollo, para efectos de planificación. Esta propuesta está conformada por tres técnicas: UML2FP, Diagrama de Precedencia de Casos de Uso (UCPD) e Incremental-FP. La aplicación práctica de la técnica Tupuy se realizó sobre base histórica obtenida de los alumnos de pregrado de la especialidad de Ingeniería Informática, quienes desarrollaron un proyecto de software de un sistema de información para una cadena de hoteles que recién iniciaba su funcionamiento. De los resultados obtenidos se confirma lo propuesto en la tesis del Dr. Pow Sang, al comparar los resultados obtenidos con pruebas previas, la diferencia entre el esfuerzo estimado y real de los proyectos, medidos con la Magnitud del Error Relativo (MRE) para todas las iteraciones, fueron menores al 20%. Por lo tanto, se puede utilizar la técnica Tupuy con toda confianza para fines de planificación.