Una metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos

dc.contributor.advisorVillanueva Talavera, Edwin Rafael
dc.contributor.authorMamani Coaquira, Yonatan
dc.date.accessioned2026-02-02T17:45:03Z
dc.date.available2026-02-02T17:45:03Z
dc.date.created2025
dc.date.issued2026-02-02
dc.description.abstractEl análisis de sentimientos ha encontrado aplicaciones en diferentes áreas como: psicología, filosofía, sociología, marketing, economía, educación, etc. En ese sentido, las redes sociales se han convertido en una herramienta para que las personas expresen sus opiniones, especialmente de forma textual. En los últimos años, la investigación basada en el conocimiento de grafos ha surgido como un enfoque innovador y prometedor de la Inteligencia Artificial (IA) para obtener una mejor representación estructurada de los datos. El presente trabajo propone una metodología no supervisada basada en el conocimiento de grafos, específicamente en la vectorización de nodos que representan palabras de las oraciones con sus respectivas relaciones conceptuales. Parte de esta metodología se construyen diccionarios de palabras clasificadas por polaridades (positiva, negativa y neutral) utilizando VADER (Valence Aware Dictionary and sEntiment Reasoner), junto a conceptos basado en grafos conceptuales de WordNet y ConceptNet. Esta metodología permite capturar las relaciones de co-ocurrencia y relaciones conceptuales, junto con la polaridad de palabras. Así mismo, se propone un algoritmo denominado Polarity-biased random Walk para construir caminos del grafo utilizando un bias de polaridad. Luego mediante el algoritmo Skip-Gram se realiza la vectorización de palabras que contiene los caminos obtenidas del grafo. Esta metodología permitió encontrar resultados como, que a mayor profundidad de caminos y número de caminos por nodo mediante un bias de 0.95 con ConceptNet o WordNet llegan a ser mejor el resultado de clasificación de polaridad de sentimientos en comparación a modelos como Node2vec, GraphSAGA, Graph Attention y Graph Convolution Networks. Así mismo, embeddings construido a partir de IMDB movie permite mejorar los resultados de precisión para aplicar en dominios espec´ıficos en comparación a modelos como Word2Vec, FastText, Glove y Bert, este último con resultados muy cercanos a las propuestas.
dc.description.abstractSentiment analysis has found applications in various fields such as psychology, philosophy, sociology, marketing, economics, education, etc. In this sense, social media has become a tool for people to express their opinions, especially in written form. In recent years, research based on graph knowledge has emerged as an innovative and promising approach of Artificial Intelligence (AI) to achieve a better structured representation of data. This work proposes an unsupervised methodology based on graph knowledge, specifically in the vectorization of nodes representing words in sentences along with their respective conceptual relationships. Part of this methodology involves building dictionaries of words classified by polarity (positive, negative, and neutral) using VADER (Valence Aware Dictionary and sEntiment Reasoner), along with concepts based on conceptual graphs from WordNet and ConceptNet. This methodology captures co-occurrence relationships and conceptual relationships, along with the polarity of words. An algorithm called Polarity-biased random Walk is also proposed to construct graph paths using a polarity bias. Then, using the Skip-Gram algorithm, the vectorization of words containing the paths obtained from the graph is performed. This methodology allowed for findings such that, with greater path depth and number of paths per node using a bias of 0.95 with ConceptNet or WordNet, the results for sentiment polarity classification improved compared to models like Node2vec, GraphSAGE, Graph Attention, and Graph Convolution Networks. Additionally, embeddings constructed from the IMDB movie dataset improve accuracy results for application in specific domains compared to models like Word2Vec, FastText, Glove, and Bert, with the latter showing results very close to the proposed methods.
dc.identifier.urihttp://hdl.handle.net/20.500.12404/33082
dc.language.isospa
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPE
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/
dc.subjectAnálisis de sentimientos
dc.subjectTeoría de grafos
dc.subjectProcesamiento de lenguaje natural (Computación)
dc.subjectAprendizaje automático (Inteligencia artificial)
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#2.00.00
dc.titleUna metodología basado en conocimiento de grafos y relaciones conceptuales de palabras para el análisis de sentimientos
dc.typeinfo:eu-repo/semantics/doctoralThesis
renati.advisor.dni29714308
renati.advisor.orcidhttps://orcid.org/0000-0002-6540-1230
renati.author.dni46707738
renati.discipline732028
renati.jurorIglesias Fernández, Carlos Á
renati.jurorVillanueva Talavera, Edwin Rafael
renati.jurorSipiran Mendoza, Ivan Anselmo
renati.jurorIrvin Franco Benito, Dongo Escalante
renati.jurorBeltran Castañon, Cesar Armando
renati.levelhttps://purl.org/pe-repo/renati/level#doctor
renati.typehttps://purl.org/pe-repo/renati/type#tesis
thesis.degree.disciplineIngenieríaes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgradoes_ES
thesis.degree.levelDoctoradoes_ES
thesis.degree.nameDoctor en Ingenieríaes_ES

Archivos

Bloque original

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
MAMANI_COAQUIRA_YONATAN_METODOLOGIA_BASADO.pdf
Tamaño:
1.23 MB
Formato:
Adobe Portable Document Format
Descripción:
Texto completo
Cargando...
Miniatura
Nombre:
MAMANI_COAQUIRA_YONATAN_T.pdf
Tamaño:
19.57 MB
Formato:
Adobe Portable Document Format
Descripción:
Reporte de originalidad

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción: