Show simple item record

dc.contributor.advisorMelgar Sasieta, Héctor Andrés
dc.contributor.authorAcuña Caicedo, Roberto Wellington
dc.date.accessioned2023-01-31T16:06:59Z
dc.date.available2023-01-31T16:06:59Z
dc.date.created2022
dc.date.issued2023-01-31
dc.identifier.urihttp://hdl.handle.net/20.500.12404/24174
dc.description.abstractLa presente tesis doctoral, con un enfoque cualicuantitativo (mixto), se enmarca en la línea del análisis de sentimientos en redes sociales, forma parte del proyecto Life, que busca crear una plataforma integral para detectar y brindar apoyo especializado a usuarios de redes sociales que publican textos con contenido suicida. Por ello se desarrolló el Corpus Life para realizar experimentos con algoritmos de aprendizaje automático, mismo que originalmente constaba de 102 mensajes suicidas (71 textos en inglés y 31 textos en español), 70 de estas muestras Sin Riesgo y 32 con Riesgo. Pero debido al escaso número de muestras y al desbalance entre ellas, los resultados generados no eran confiables. Por ello esta investigación tuvo como objetivo general desarrollar un método semi-supervisado para detectar, clasificar y anotar en el Corpus Life, textos extraídos de entornos digitales, con el fin de incrementar su número de anotaciones, mediante un proceso de evaluación automática de su calidad, previo a su inclusión o exclusión. Anotaciones que fueron evaluadas manualmente, utilizando para ello la medida de concordancia Cohen´s Kappa, con la participación de anotadores especializados quienes evaluaron los textos, alcanzando un nivel de acuerdo entre anotadores de 0,86, cercano al 0,78-0,81 de significancia estadística alcanzado automáticamente por medio del índice macro f1, con el método semi-supervisado. Lo que conllevo a alcanzar experimentos de un mayor grado de confiabilidad, por medio de un método estructurado con actividades, roles y procesos bien definidos y enlazados.es_ES
dc.description.abstractThis doctoral thesis with a qualitative-quantitative (mixed) approach is part of the analysis of feelings in social networks that publish texts with suicidal content. For this reason, Corpus life was developed to carry out experiments with machine learning algorithms, which originally consisted of 102 suicide messages (71 texts in English and 31 texts in Spanish), 70 of these samples without risk and 32 with risk. But due to the small number of samples and the imbalance between them, the generated outcome was not reliable. Therefore, this research had the general objective of developing a semi-supervised method to detect, classify and annotate in the Corpus Life, texts extracted from digital environments, in order to increase their number of annotations, through a process of automatic assessments of their quality, prior to their inclusion or exclusion. Records which were tested manually, using the Cohen's Kappa concordance measure, with the participation of specialized annotators who evaluated the texts, reaching a level of agreement between annotators of 0.86, close to 0.78-0.81 of statistically significant reaching automatically by means of the f1 macro index, with the semi-supervised method. This led to achieving experiments with a higher degree of reliability, through a structured method with well-defined and linked activities, roles and processes.es_ES
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rightsAtribución 2.5 Perú*
dc.rights.urihttp://creativecommons.org/licenses/by/2.5/pe/*
dc.subjectAprendizaje automático (Inteligencia artificial)es_ES
dc.subjectProcesamiento de datoses_ES
dc.subjectSuicidioes_ES
dc.titleMétodo semi-supervisado para detectar, clasificar y anotar en un corpus de suicidio textos extraídos de entornos digitaleses_ES
dc.typeinfo:eu-repo/semantics/doctoralThesises_ES
thesis.degree.nameDoctor en Ingenieríaes_ES
thesis.degree.levelDoctoradoes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgradoes_ES
thesis.degree.disciplineIngenieríaes_ES
renati.advisor.dni10145776
renati.advisor.orcidhttps://orcid.org/0000-0003-1110-123Xes_ES
renati.author.pasaporte1307094936
renati.discipline732028es_ES
renati.jurorBravo Márquez, Felipe Josées_ES
renati.jurorMelgar Sasieta, Hector Andreses_ES
renati.jurorGómez Soriano, José Manueles_ES
renati.jurorBeltran Castañon, Cesar Armandoes_ES
renati.jurorPaz Espinoza, Freddy Albertoes_ES
renati.levelhttps://purl.org/pe-repo/renati/level#doctores_ES
renati.typehttps://purl.org/pe-repo/renati/type#tesises_ES
dc.publisher.countryPEes_ES
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#2.00.00es_ES


Files in this item

Thumbnail
Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess