Show simple item record

dc.contributor.advisorOncevay Marcos, Felix Arturo
dc.contributor.authorUbaldo Gamarra, Victoria Alejandra
dc.date.accessioned2022-11-09T19:30:56Z
dc.date.available2022-11-09T19:30:56Z
dc.date.created2022
dc.date.issued2022-11-09
dc.identifier.urihttp://hdl.handle.net/20.500.12404/23751
dc.description.abstractEn la actualidad, para los más de 30 millones de peruanos, la información a la que accedemos se encuentra mayormente en el idioma español. Sin embargo Perú es un país multilingüe, posee una gran riqueza cultural y lingüística con alrededor de 47 lenguas originarias. Para esta población encontrar textos, noticias y contenido en internet en su lengua nativa es una tarea complicada. Existe un limitado acceso a información como lecturas, textos, noticias u otros contenidos que en modalidad digital es muy escaso. Esto se debe a que los pocos ciudadanos que se comunican en lenguas nativas son de manera oral y algunos hacen uso del español sobre sus lenguas nativas. De ese modo, existen investigaciones en el campo de la inteligencia artificial donde a partir del poco material digital recolectado de lenguas nativas se construyeron corpus digitales para tareas de traducción automática y detección del lenguaje. Sin embargo, aún son corpus pequeños para elaborar traductores de calidad, presentan complicaciones en traducir textos completos, y además díficil el aprendizaje con algoritmos complejos, como redes neuronales profundas. Por este motivo se propone realizar una minería web de textos en la lengua originaria quechua sureño para incrementar la cantidad de oraciones y diversidad de dominios, evaluar la calidad de los nuevos textos en un modelo de traducción automática de quechua a español, y desarrollar una web de libre acceso de consulta al corpus creado.es_ES
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-sa/2.5/pe/*
dc.subjectInteligencia artificiales_ES
dc.subjectRedes neuronales (Computación)es_ES
dc.subjectMinería de datoses_ES
dc.subjectQuechua--Perúes_ES
dc.titleMinería web de textos en lenguas indígenas para desarrollar tecnologías de lenguaje. Caso de estudio: quechua sureñoes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
thesis.degree.nameMaestro en Informática con mención en Ciencias de la Computaciónes_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgrado.es_ES
thesis.degree.disciplineInformática con mención en Ciencias de la Computaciónes_ES
renati.advisor.dni46440101
renati.advisor.orcidhttps://orcid.org/0000-0001-7675-6208es_ES
renati.author.dni70808752
renati.discipline611087es_ES
renati.jurorGomez Montoya, Hector Erasmoes_ES
renati.jurorOncevay Marcos, Felix Arturoes_ES
renati.jurorAyma Quirita, Victor Andreses_ES
renati.levelhttps://purl.org/pe-repo/renati/level#maestroes_ES
renati.typehttps://purl.org/pe-repo/renati/type#tesises_ES
dc.publisher.countryPEes_ES
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.00es_ES


Files in this item

Thumbnail
Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess