Modelo algorítmico para la clasificación de documentos de carácter judicial en lenguaje portugués según su contenido
Abstract
En los últimos años la generación de información virtual ha aumentado
considerablemente. Parte de esa información se encuentra almacenada en bases de
datos de instituciones públicas y privadas. Sin embargo, no toda la información
almacenada de forma electrónica tiene una estructura definida, tal es el caso de los
documentos donde encontramos secuencias de palabras no estructuradas, los cuales
según estudios representan el 80% de la información de las empresas.
La tarea de clasificar automáticamente documentos tiene como motivo principal brindar
una herramienta de mejora en la gestión de la información, la cual es considerada como
condición indispensable para el éxito de cualquiera empresa.
Ante esto, en el propósito del proyecto se propone la obtención de un modelo algorítmico
para la clasificación automática de documentos de carácter judicial en lenguaje portugués
según su contenido con el fin de automatizar las labores manuales involucradas en el
proceso, y con ello disminuir los recursos implicados en la tarea de clasificación. La
colección de documentos será brindada por una empresa en Brasil encargada de la
clasificación manual de intimaciones a través de especialistas, llamados procuradores.
Las intimaciones son documentos que son enviados desde los tribunales hacia las
procuradurías durante un proceso de juicio.
Temas
Procesamiento de textos
Minería de datos--Algoritmos
Recuperación de la información
Minería de datos--Algoritmos
Recuperación de la información
Para optar el título de
Ingeniero Informático