Síntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo

dc.contributor.advisorGómez Montoya, Héctor Erasmo
dc.contributor.authorMenéndez Quinto, Daniel Arturo
dc.date.accessioned2025-03-18T15:14:49Z
dc.date.created2024
dc.date.issued2025-03-18
dc.description.abstractActualmente, existe consenso entre numerosos lingüistas en que, de las más de 7000 lenguas conocidas en el mundo, muchas están en peligro de extinción en distintos grados. Por ello, su documentación y revitalización son tareas esenciales, no solo para conservarlas, sino también para preservar formas únicas de comunicación y valiosas maneras de comprender el mundo. Esta investigación busca ser un paso inicial en la revitalización de lenguas amenazadas, enfocándose en el Shipibo-Konibo. Esta lengua, hablada principalmente en la Amazonía peruana, enfrenta desafíos como la escasez de datos, la coexistencia de diferentes tradiciones ortográficas y una documentación limitada, lo que lo clasifica como una lengua de pocos recursos. En respuesta a estos retos, este artículo presenta el desarrollo de un modelo de síntesis de texto a voz (TTS) para el Shipibo-Konibo basado en la arquitectura Tacotron 2 y HiFi-GAN como vocoder, superando diversas dificultades técnicas para lograr una solución capaz de generar audio de alta calidad. Se requirió la recopilación de un corpus que incluye más de 4 horas de grabaciones y 3,025 frases escritas, obtenidas de textos educativos y traducciones literarias. Las grabaciones fueron realizadas con la ayuda de un hablante nativo, asegurando un alto estándar de calidad para el entrenamiento del modelo. Los resultados fueron prometedores, alcanzando una tasa de inteligibilidad del 88.56% y una puntuación media de opinión (MOS) de 4.01. Estas métricas llegaron incluso a superar la calidad percibida de la voz natural en las pruebas realizadas, lo que demuestra el potencial del modelo para adaptarse a otros idiomas de la familia pano u otras lenguas amazónicas.
dc.identifier.urihttp://hdl.handle.net/20.500.12404/30275
dc.language.isospa
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPE
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-sa/2.5/pe/
dc.subjectSíntesis del habla
dc.subjectShipibo-Conibo
dc.subjectLenguas indígenas--Perú
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.00
dc.titleSíntesis de voz para lenguas de pocos recursos: El caso Shipibo- Konibo
dc.typeinfo:eu-repo/semantics/masterThesis
renati.advisor.dni70599170
renati.advisor.orcidhttps://orcid.org/0000-0002-1338-3392
renati.author.dni42735246
renati.discipline611087
renati.jurorMelgar Sasieta, Hector Andres
renati.jurorGómez Montoya, Héctor Erasmo
renati.jurorSobrevilla Cabezudo, Marco Antonio
renati.levelhttps://purl.org/pe-repo/renati/level#maestro
renati.typehttps://purl.org/pe-repo/renati/type#trabajoDeInvestigacion
thesis.degree.disciplineInformática con mención en Ciencias de la Computaciónes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgrado.es_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.nameMaestro en Informática con mención en Ciencias de la Computaciónes_ES

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
MENENDEZ_QUINTO_DANIEL_ARTURO_SINTESIS_VOZ.pdf
Size:
433.4 KB
Format:
Adobe Portable Document Format
Description:
Texto completo
Loading...
Thumbnail Image
Name:
MENENDEZ_QUINTO_DANIEL_ARTURO_T.pdf
Size:
2.37 MB
Format:
Adobe Portable Document Format
Description:
Reporte de originalidad

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: