Herramienta de análisis y clasificación de complejidad de textos en español
Date
2015-06-04
Journal Title
Journal ISSN
Volume Title
Publisher
Pontificia Universidad Católica del Perú
Abstract
La selección de textos es una de las responsabilidades principales de los profesores
dentro del planeamiento del orden de exposición a textos para sus alumnos. Debido a
la gran cantidad de textos disponibles y la diversidad de géneros y temas, esta tarea
demanda mucho tiempo y está ligada a aspectos subjetivos del evaluador. Esto es un
problema, sobre el cual proponemos una alternativa de automatización.
Se toma como proyecto la implementación de una herramienta de análisis y
clasificación de complejidad de tetos en español. Con ello se busca brindar una
alternativa automatizada al problema de escalabilidad en complejidad de textos. Esto
se refiere a la necesidad de tener un orden de textos evaluados por complejidad.
Para ello evaluamos la complejidad utilizando las métricas de Coh-Metrix adaptadas al
español. Este conjunto de métricas evalúa textos en inglés de acuerdo a los estudios
de coherencia y cohesión que los autores de Coh-Metrix desarrollaron.
En base a esta adatapación de Coh-Metrix se desarrolló un clasificador basado en
técnicas de aprenizaje de máquina y un conjunto de textos en español conformado por
fábulas y cuentos previamente clasificados. Finalmente estos componentes fueron
unidos en una herraamienta web para la accesibilidad pública de la herramienta
desarrollada.
Description
Keywords
Procesamiento de textos, Programas para computadoras--Medición, Lingüística computacional
Citation
Collections
Endorsement
Review
Supplemented By
Referenced By
Creative Commons license
Except where otherwised noted, this item's license is described as Atribución-NoComercial-SinDerivadas 2.5 Perú