Generación de corpus paralelos para la implementación de un traductor automático estadístico entre shipibo-konibo y español
Abstract
Actualmente, existe información que debe estar disponible para todos los habitantes de
nuestro país, tales como textos educativos, leyes y noticias. Sin embargo, a pesar que el Perú es un
país multilingüe, la mayoría de textos se encuentran redactados únicamente en español. Una de las
razones por las que no se traducen estos textos a otras lenguas habladas en nuestro país es porque
el proceso es costoso y requiere de mucho tiempo. Por este motivo se propone desarrollar un
traductor automático basado en colecciones de textos, también llamados corpus, que utilice
métodos estadísticos y pueda servir de apoyo una plataforma de software de traducción automática
de texto entre el español y el shipibo-konibo.
Para implementar un método estadístico, es necesario contar con corpus paralelos en los
idiomas a traducir. Esto representa un problema, pues existen muy pocos textos escritos en shipibokonibo,
y la mayoría de estos no cuenta con una traducción al español. Por este motivo es necesario
construir corpus paralelos en base a dos procesos: la traducción de textos del shipibo-konibo al
español (y viceversa) y la alineación semi-automática de los textos bilingües disponibles. Con los
corpus paralelos obtenidos, se puede entrenar y validar un traductor automático, a fin de encontrar
los parámetros que generan las mejores traducciones. Además, en base a los resultados obtenidos,
se determinará la etapa en la que el traductor estadístico se integrará a la plataforma de software de
traducción automática que será implementada por investigadores del Grupo de Reconocimiento de
Patrones e Inteligencia Artificial Aplicada (GRPIAA) y el departamento de lingüística de la PUCP.
Temas
Traductores--Programas para computadoras
Traductores--Métodos estadísticos
Traductores--Shipibo-Conibo
Traductores--Lenguas indígenas
Traductores--Español
Traductores--Métodos estadísticos
Traductores--Shipibo-Conibo
Traductores--Lenguas indígenas
Traductores--Español
Para optar el título de
Maestro en Informática con mención en Ciencias de la Computación
The following license files are associated with this item:
Related items
Showing items related by title, author, creator and subject.
-
A crowd-powered conversational assistant for the improvement of a neural machine translation system in native peruvian language
Gómez Montoya, Héctor Erasmo (Pontificia Universidad Católica del PerúPE, 2019-09-13)Para las comunidades más pequeñas y nativas en un país, es muy difícil encontrar información que se encuentre en su idioma original, esto debido a que su lengua no tiene el alcance ni la cantidad suficiente de hablantes, ... -
Hacia una tipología de los fenómenos de variación morfológica en el Shipibo-Konibo: una contribución para su traducción automática
Castro Williams, Marcela Alejandra (Pontificia Universidad Católica del PerúPE, 2018-08-27)La lengua shipibo-konibo (SK) es una de las más grandes de la Amazonía peruana. Debido a su numerosa población vernácula que alcanza los 23.000 hablantes, fue favorecida por un proyecto que busca proveer a las lenguas ... -
La competencia traductora en la formación de traductores
Yañez Ruiz, Paola Isabel (Pontificia Universidad Católica del PerúPE, 2023-12-14)Los cambios globales y la diversificación del mercado de traducción han ampliado los roles desempeñados por el traductor, lo que implica que a las competencias enseñadas y desarrolladas hasta ahora se suman otras. Esto ...