Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
Abstract
Actualmente, existe información que debe estar disponible para todos los habitantes de
nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un
país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las
razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque
el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un
traductor automático basado en colecciones de textos, también llamados corpus, que utilice
métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática
de texto entre el español y el shipibo-konibo.
Para implementar un método estadístico, es necesario contar con corpus paralelos en los
idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo,
y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario
construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al
español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los
corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar
los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos,
se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de
traducción automática que será implementada por investigadores del Grupo de Reconocimiento de
Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP.
Temas
Traductores--Programas para computadoras
Traductores--Métodos estadísticos
Traductores--Shipibo-Conibo
Traductores--Lenguas indígenas
Traductores--Español
Traductores--Métodos estadísticos
Traductores--Shipibo-Conibo
Traductores--Lenguas indígenas
Traductores--Español
Para optar el título de
Maestro en Informática con mención en Ciencias de la Computación
The following license files are associated with this item:
Related items
Showing items related by title, author, creator and subject.
-
A crowd-powered conversational assistant for the improvement of a neural machine translation system in native peruvian language
Gómez Montoya, Héctor Erasmo (Pontificia Universidad Católica del PerúPE, 2019-09-13)Para las comunidades más pequeñas y nativas en un país, es muy difícil encontrar información que se encuentre en su idioma original, esto debido a que su lengua no tiene el alcance ni la cantidad suficiente de hablantes, ... -
Hacia una tipología de los fenómenos de variación morfológica en el Shipibo-Konibo: una contribución para su traducción automática
Castro Williams, Marcela Alejandra (Pontificia Universidad Católica del PerúPE, 2018-08-27)La lengua shipibo-konibo (SK) es una de las más grandes de la Amazonía peruana. Debido a su numerosa población vernácula que alcanza los 23.000 hablantes, fue favorecida por un proyecto que busca proveer a las lenguas ... -
Desambiguación de morfemas polifuncionales en la traducción automática de lenguas minoritarias: el caso del enclítico =n en el shipibo-konibo
Ego Aguirre Santa Cruz, Renzo Alberto (Pontificia Universidad Católica del PerúPE, 2018-11-12)La presente tesis ofrece una solución para las dificultades que constituyen los morfemas polisémicos en el marco de la traducción automática de lenguas minoritarias. El caso concreto en el que se enfoca este trabajo de ...