Desarrollo de recursos léxicos multi-dialécticos para el quechua

dc.contributor.advisorGómez Montoya, Héctor Erasmo
dc.contributor.authorMelgarejo Vergara, Nelsi Belly
dc.date.accessioned2023-03-13T19:52:06Z
dc.date.available2023-03-13T19:52:06Z
dc.date.created2022
dc.date.issued2023-03-13
dc.description.abstractLas lenguas de bajos recursos como el quechua no cuentan con recursos léxicos a pesar de ser importantes para contribuir en las investigaciones y en el desarrollo de muchas herramientas de Procesamiento de Lenguaje Natural (NLP) que se benefician o requieren de recursos de este tipo, de esa forma poder contribuir en la preservación de la lengua. El objetivo de esta investigación es construir una WordNet (base de datos léxica) para las variedades quechua sureño, central, amazónico y norteño, y un un etiquetado gramatical de secuencias de palabras (POS tagging) para la variedad del quechua sureño. Para el desarrollo de esta investigación se recopiló información de los diccionarios y se creó corpus paralelo quechua - español, se implementó un algoritmo de clasificación para alinear el sentido de las palabras con el synset del significado en español para cada variedad de la lengua quechua y finalmente se creó un modelo de etiquetación gramatical basado en el modelo BERT. El score obtenido para el POS tagging de la variedad quechua sureño fue 0.85% y para el quechua central 0.8 %.es_ES
dc.identifier.urihttp://hdl.handle.net/20.500.12404/24477
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPEes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/*
dc.subjectProcesamiento en lenguaje natural (Informática)es_ES
dc.subjectAlgoritmos computacionaleses_ES
dc.subjectQuechua--Estudio y enseñanzaes_ES
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.00es_ES
dc.titleDesarrollo de recursos léxicos multi-dialécticos para el quechuaes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
renati.advisor.dni70599170
renati.advisor.orcidhttps://orcid.org/0000-0002-1338-3392es_ES
renati.author.dni71432187
renati.discipline611087es_ES
renati.jurorVillanueva Talavera, Edwin Rafaeles_ES
renati.jurorGomez Montoya, Hector Erasmoes_ES
renati.jurorOncevay Marcos, Felix Arturoes_ES
renati.levelhttps://purl.org/pe-repo/renati/level#maestroes_ES
renati.typehttps://purl.org/pe-repo/renati/type#tesises_ES
thesis.degree.disciplineInformática con mención en Ciencias de la Computaciónes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgrado.es_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.nameMaestro en Informática con mención en Ciencias de la Computaciónes_ES

Files

Original bundle

Now showing 1 - 2 of 2
Thumbnail Image
Name:
MELGAREJO_VERGARA_NELSI_DESARROLLO_RECURSOS_LEXICOS.pdf
Size:
610.59 KB
Format:
Adobe Portable Document Format
Description:
Texto completo
No Thumbnail Available
Name:
MELGAREJO_VERGARA_NELSI_BELLY_T.pdf
Size:
6.43 MB
Format:
Adobe Portable Document Format
Description:
Reporte de originalidad

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: