Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes

dc.contributor.advisorOncevay Marcos, Félix Arturoes_ES
dc.contributor.authorBustamante Alvarez, Ginaes_ES
dc.date.accessioned2019-09-13T01:43:27Zes_ES
dc.date.available2019-09-13T01:43:27Zes_ES
dc.date.created2019es_ES
dc.date.issued2019-09-12es_ES
dc.description.abstractActualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.es_ES
dc.identifier.urihttp://hdl.handle.net/20.500.12404/14983
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPEes_ES
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc/2.5/pe/*
dc.subjectInterfaces de computadoras--Diseño y construcciónes_ES
dc.subjectInformación--Almacenamiento y recuperaciónes_ES
dc.subjectAlgoritmos--Procesamiento de datoses_ES
dc.subjectAnálisis de datoses_ES
dc.subjectPrevención del delitoes_ES
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.02.00es_ES
dc.titleExtracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímeneses_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
renati.advisor.dni46440101
renati.advisor.orcidhttps://orcid.org/0000-0001-7675-6208es_ES
renati.discipline612286es_ES
renati.levelhttps://purl.org/pe-repo/renati/level#tituloProfesionales_ES
renati.typehttps://purl.org/pe-repo/renati/type#tesises_ES
thesis.degree.disciplineIngeniería Informáticaes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Facultad de Ciencias e Ingenieríaes_ES
thesis.degree.levelTítulo Profesionales_ES
thesis.degree.nameIngeniero Informáticoes_ES

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
BUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf
Size:
14.64 MB
Format:
Adobe Portable Document Format
Description:
Texto completo

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.61 KB
Format:
Item-specific license agreed upon to submission
Description: