Desarrollo de recursos léxicos multi-dialécticos para el quechua
dc.contributor.advisor | Gómez Montoya, Héctor Erasmo | |
dc.contributor.author | Melgarejo Vergara, Nelsi Belly | |
dc.date.accessioned | 2023-03-13T19:52:06Z | |
dc.date.available | 2023-03-13T19:52:06Z | |
dc.date.created | 2022 | |
dc.date.issued | 2023-03-13 | |
dc.description.abstract | Las lenguas de bajos recursos como el quechua no cuentan con recursos léxicos a pesar de ser importantes para contribuir en las investigaciones y en el desarrollo de muchas herramientas de Procesamiento de Lenguaje Natural (NLP) que se benefician o requieren de recursos de este tipo, de esa forma poder contribuir en la preservación de la lengua. El objetivo de esta investigación es construir una WordNet (base de datos léxica) para las variedades quechua sureño, central, amazónico y norteño, y un un etiquetado gramatical de secuencias de palabras (POS tagging) para la variedad del quechua sureño. Para el desarrollo de esta investigación se recopiló información de los diccionarios y se creó corpus paralelo quechua - español, se implementó un algoritmo de clasificación para alinear el sentido de las palabras con el synset del significado en español para cada variedad de la lengua quechua y finalmente se creó un modelo de etiquetación gramatical basado en el modelo BERT. El score obtenido para el POS tagging de la variedad quechua sureño fue 0.85% y para el quechua central 0.8 %. | es_ES |
dc.identifier.uri | http://hdl.handle.net/20.500.12404/24477 | |
dc.language.iso | spa | es_ES |
dc.publisher | Pontificia Universidad Católica del Perú | es_ES |
dc.publisher.country | PE | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/2.5/pe/ | * |
dc.subject | Procesamiento en lenguaje natural (Informática) | es_ES |
dc.subject | Algoritmos computacionales | es_ES |
dc.subject | Quechua--Estudio y enseñanza | es_ES |
dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#1.02.00 | es_ES |
dc.title | Desarrollo de recursos léxicos multi-dialécticos para el quechua | es_ES |
dc.type | info:eu-repo/semantics/masterThesis | es_ES |
renati.advisor.dni | 70599170 | |
renati.advisor.orcid | https://orcid.org/0000-0002-1338-3392 | es_ES |
renati.author.dni | 71432187 | |
renati.discipline | 611087 | es_ES |
renati.juror | Villanueva Talavera, Edwin Rafael | es_ES |
renati.juror | Gomez Montoya, Hector Erasmo | es_ES |
renati.juror | Oncevay Marcos, Felix Arturo | es_ES |
renati.level | https://purl.org/pe-repo/renati/level#maestro | es_ES |
renati.type | https://purl.org/pe-repo/renati/type#tesis | es_ES |
thesis.degree.discipline | Informática con mención en Ciencias de la Computación | es_ES |
thesis.degree.grantor | Pontificia Universidad Católica del Perú. Escuela de Posgrado. | es_ES |
thesis.degree.level | Maestría | es_ES |
thesis.degree.name | Maestro en Informática con mención en Ciencias de la Computación | es_ES |
Files
Original bundle
1 - 2 of 2
- Name:
- MELGAREJO_VERGARA_NELSI_DESARROLLO_RECURSOS_LEXICOS.pdf
- Size:
- 610.59 KB
- Format:
- Adobe Portable Document Format
- Description:
- Texto completo
No Thumbnail Available
- Name:
- MELGAREJO_VERGARA_NELSI_BELLY_T.pdf
- Size:
- 6.43 MB
- Format:
- Adobe Portable Document Format
- Description:
- Reporte de originalidad
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: