Corrección ortográfica de lenguas amazónicas usando redes neuronales secuencia a secuencia

dc.contributor.advisorOncevay Marcos, Félix Arturo
dc.contributor.authorLara Avila, César Jesús
dc.date.accessioned2020-05-26T15:41:39Z
dc.date.available2020-05-26T15:41:39Z
dc.date.created2020
dc.date.issued2020-05-26
dc.description.abstractDe acuerdo a la Base de Datos Oficial de Pueblos Indígenas u Originarios (BDPI), el Perú cuenta con 55 pueblos indígenas, identificados hasta la fecha; que hablan al menos 47 lenguas originarias y que según el Documento Nacional de Lenguas Originarias del Perú están divididos en 19 familias lingüísticas, siendo las familias Pano y Arawak las que presentan una mayor cantidad de lenguas, ambas con 10 lenguas. En este trabajo, se plantea un modelo de corrección ortográfica utilizando modelos de redes neuronales profundas, a nivel de caracteres, en lenguas de las dos familias antes mencionadas: Shipibo-Konibo de la familia Pano y Yanesha, Yine y Ashaninka para la familia Arawak. Para ello se han realizamos experimentos en conjuntos de datos obtenidos de páginas como PerúEduca, incorporando errores ortográficas cometidos a nivel de caracteres, en modelos secuencia a secuencia (seq2seq) que han demostrado recientemente ser un marco exitoso para varias tareas de procesamiento de lenguaje natural, incluyendo el proceso de corrección ortográfica.es_ES
dc.description.uriTesises_ES
dc.identifier.urihttp://hdl.handle.net/20.500.12404/16265
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPEes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/*
dc.subjectLingüística computacionales_ES
dc.subjectLenguas indígenas--Perúes_ES
dc.subjectRedes neuronaleses_ES
dc.subjectOrtografíaes_ES
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.00es_ES
dc.titleCorrección ortográfica de lenguas amazónicas usando redes neuronales secuencia a secuenciaes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
renati.advisor.dni46440101
renati.discipline611087es_ES
renati.levelhttps://purl.org/pe-repo/renati/level#maestroes_ES
renati.typehttps://purl.org/pe-repo/renati/type#tesises_ES
thesis.degree.disciplineInformática con mención en Ciencias de la Computaciónes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgradoes_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.nameMaestro en Informática con mención en Ciencias de la Computaciónes_ES

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
LARA_AVILA_CESAR_CORRECCION_ORTOGRAFICA_LENGUAS.pdf
Size:
1.36 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.61 KB
Format:
Item-specific license agreed upon to submission
Description: