Minería web de textos en lenguas indígenas para desarrollar tecnologías de lenguaje. Caso de estudio: quechua sureño

Ubaldo Gamarra, Victoria Alejandra

dc.contributor.advisor	Oncevay Marcos, Felix Arturo
dc.contributor.author	Ubaldo Gamarra, Victoria Alejandra
dc.date.accessioned	2022-11-09T19:30:56Z
dc.date.available	2022-11-09T19:30:56Z
dc.date.created	2022
dc.date.issued	2022-11-09
dc.identifier.uri	http://hdl.handle.net/20.500.12404/23751
dc.description.abstract	En la actualidad, para los más de 30 millones de peruanos, la información a la que accedemos se encuentra mayormente en el idioma español. Sin embargo Perú es un país multilingüe, posee una gran riqueza cultural y lingüística con alrededor de 47 lenguas originarias. Para esta población encontrar textos, noticias y contenido en internet en su lengua nativa es una tarea complicada. Existe un limitado acceso a información como lecturas, textos, noticias u otros contenidos que en modalidad digital es muy escaso. Esto se debe a que los pocos ciudadanos que se comunican en lenguas nativas son de manera oral y algunos hacen uso del español sobre sus lenguas nativas. De ese modo, existen investigaciones en el campo de la inteligencia artificial donde a partir del poco material digital recolectado de lenguas nativas se construyeron corpus digitales para tareas de traducción automática y detección del lenguaje. Sin embargo, aún son corpus pequeños para elaborar traductores de calidad, presentan complicaciones en traducir textos completos, y además díficil el aprendizaje con algoritmos complejos, como redes neuronales profundas. Por este motivo se propone realizar una minería web de textos en la lengua originaria quechua sureño para incrementar la cantidad de oraciones y diversidad de dominios, evaluar la calidad de los nuevos textos en un modelo de traducción automática de quechua a español, y desarrollar una web de libre acceso de consulta al corpus creado.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Pontificia Universidad Católica del Perú	es_ES
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-sa/2.5/pe/	*
dc.subject	Inteligencia artificial	es_ES
dc.subject	Redes neuronales (Computación)	es_ES
dc.subject	Minería de datos	es_ES
dc.subject	Quechua--Perú	es_ES
dc.title	Minería web de textos en lenguas indígenas para desarrollar tecnologías de lenguaje. Caso de estudio: quechua sureño	es_ES
dc.type	info:eu-repo/semantics/masterThesis	es_ES
thesis.degree.name	Maestro en Informática con mención en Ciencias de la Computación	es_ES
thesis.degree.level	Maestría	es_ES
thesis.degree.grantor	Pontificia Universidad Católica del Perú. Escuela de Posgrado.	es_ES
thesis.degree.discipline	Informática con mención en Ciencias de la Computación	es_ES
renati.advisor.dni	46440101
renati.advisor.orcid	https://orcid.org/0000-0001-7675-6208	es_ES
renati.author.dni	70808752
renati.discipline	611087	es_ES
renati.juror	Gomez Montoya, Hector Erasmo	es_ES
renati.juror	Oncevay Marcos, Felix Arturo	es_ES
renati.juror	Ayma Quirita, Victor Andres	es_ES
renati.level	https://purl.org/pe-repo/renati/level#maestro	es_ES
renati.type	https://purl.org/pe-repo/renati/type#tesis	es_ES
dc.publisher.country	PE	es_ES
dc.subject.ocde	https://purl.org/pe-repo/ocde/ford#1.02.00	es_ES