Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Católica del Perú
Acceso al texto completo solo para la Comunidad PUCP
Abstract
Actualmente, existe consenso entre numerosos lingüistas en que, de las más de 7000 lenguas conocidas
en el mundo, muchas están en peligro de extinción en distintos grados. Por ello, su documentación y
revitalización son tareas esenciales, no solo para conservarlas, sino también para preservar formas únicas
de comunicación y valiosas maneras de comprender el mundo.
Esta investigación busca ser un paso inicial en la revitalización de lenguas amenazadas, enfocándose en el
Shipibo-Konibo. Esta lengua, hablada principalmente en la Amazonía peruana, enfrenta desafíos como la
escasez de datos, la coexistencia de diferentes tradiciones ortográficas y una documentación limitada, lo
que lo clasifica como una lengua de pocos recursos.
En respuesta a estos retos, este artículo presenta el desarrollo de un modelo de síntesis de texto a voz
(TTS) para el Shipibo-Konibo basado en la arquitectura Tacotron 2 y HiFi-GAN como vocoder,
superando diversas dificultades técnicas para lograr una solución capaz de generar audio de alta calidad.
Se requirió la recopilación de un corpus que incluye más de 4 horas de grabaciones y 3,025 frases
escritas, obtenidas de textos educativos y traducciones literarias. Las grabaciones fueron realizadas con la
ayuda de un hablante nativo, asegurando un alto estándar de calidad para el entrenamiento del modelo.
Los resultados fueron prometedores, alcanzando una tasa de inteligibilidad del 88.56% y una puntuación
media de opinión (MOS) de 4.01. Estas métricas llegaron incluso a superar la calidad percibida de la voz
natural en las pruebas realizadas, lo que demuestra el potencial del modelo para adaptarse a otros idiomas
de la familia pano u otras lenguas amazónicas.
Description
Citation
Endorsement
Review
Supplemented By
Referenced By
Creative Commons license
Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess