Detección de ciberbullying en español para el dominio de corpus de texto teatrales aplicado a redes sociales usando transferencia de aprendizaje y validación adversarial

dc.contributor.advisorGómez Montoya, Héctor Erasmo
dc.contributor.authorMarquez Zavaleta, Esli Samuel
dc.date.accessioned2024-11-20T14:48:03Z
dc.date.available2024-11-20T14:48:03Z
dc.date.created2024
dc.date.issued2024-11-20
dc.description.abstractEl aprendizaje de los modelos de detección de ciberbullying en redes sociales depende significativamente del conjunto de datos en cual fue entrenado lo que puede limitar su capacidad de generalización a otros conjuntos de datos. Este estudio propone un enfoque innovador utilizando transferencia de aprendizaje. Se desarrolló un modelo robusto de detección de ciberbullying basado en guiones teatrales, que ofrecen contextos ricos y variados. Para ello, se creó un corpus en español a partir de estos guiones, el cual fue meticulosamente etiquetado por expertos. Posteriormente, el modelo fue entrenado con este corpus para establecer una base de conocimiento que se aplicó luego a otros corpus de redes sociales. Los resultados mostraron una exactitud del 83% en las pruebas realizadas. Complementamos dicho modelo con una validación utilizando ejemplos adversarios, a partir de técnicas de data aumentada generamos más oraciones para fortalecer su capacidad de generalización, mejorando su desempeño tanto en su corpus como en distintos dominios de ciberbullying.es_ES
dc.description.abstractThe learning of cyberbullying detection models in social networks depends significantly on the data set on which it was trained, which can limit its generalization capacity to other data sets. This study proposes an innovative approach using transfer learning. A robust cyberbullying detection model was developed based on theatrical scripts, which offer rich and varied contexts. To do this, a Spanish corpus was created from these scripts, which experts meticulously labeled. The model was then trained with this corpus to establish a knowledge base that was then applied to other social media corpora. The results showed an accuracy of 83% in the tests carried out. We complement this model with a validation using adversarial examples, using augmented data techniques we generate more sentences to strengthen its generalization capacity, improving its performance both in its corpus and in different cyberbullying domains.es_ES
dc.identifier.urihttp://hdl.handle.net/20.500.12404/29464
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPEes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rightsAtribución 2.5 Perú*
dc.rights.urihttp://creativecommons.org/licenses/by/2.5/pe/*
dc.subjectCiberacosoes_ES
dc.subjectRedes sociales en líneaes_ES
dc.subjectTransferencia de aprendizajees_ES
dc.subjectAprendizaje automático (Inteligencia artificial)es_ES
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.00es_ES
dc.titleDetección de ciberbullying en español para el dominio de corpus de texto teatrales aplicado a redes sociales usando transferencia de aprendizaje y validación adversariales_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
renati.advisor.dni70599170
renati.advisor.orcidhttps://orcid.org/0000-0002-1338-3392es_ES
renati.author.dni70388478
renati.discipline611077es_ES
renati.jurorOncevay Marcos, Felix Arturoes_ES
renati.jurorGómez Montoya, Héctor Erasmoes_ES
renati.jurorSobrevilla Cabezudo, Marco Antonioes_ES
renati.levelhttps://purl.org/pe-repo/renati/level#maestroes_ES
renati.typehttps://purl.org/pe-repo/renati/type#trabajoDeInvestigaciones_ES
thesis.degree.disciplineInformáticaes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgrado.es_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.nameMaestro en Informáticaes_ES

Files

Original bundle

Now showing 1 - 2 of 2
Thumbnail Image
Name:
MARQUEZ_ZAVALETA_ESLI_SAMUEL_DETECCION_CIBERBULLYNG.pdf
Size:
817.43 KB
Format:
Adobe Portable Document Format
Description:
Texto completo
No Thumbnail Available
Name:
MARQUEZ_ZAVALETA_ESLI_SAMUEL_T.pdf
Size:
2.33 MB
Format:
Adobe Portable Document Format
Description:
Reporte de originalidad

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections