Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
dc.contributor.advisor | Oncevay Marcos, Félix Arturo | es_ES |
dc.contributor.author | Bustamante Alvarez, Gina | es_ES |
dc.date.accessioned | 2019-09-13T01:43:27Z | es_ES |
dc.date.available | 2019-09-13T01:43:27Z | es_ES |
dc.date.created | 2019 | es_ES |
dc.date.issued | 2019-09-12 | es_ES |
dc.description.abstract | Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos. | es_ES |
dc.identifier.uri | http://hdl.handle.net/20.500.12404/14983 | |
dc.language.iso | spa | es_ES |
dc.publisher | Pontificia Universidad Católica del Perú | es_ES |
dc.publisher.country | PE | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/2.5/pe/ | * |
dc.subject | Interfaces de computadoras--Diseño y construcción | es_ES |
dc.subject | Información--Almacenamiento y recuperación | es_ES |
dc.subject | Algoritmos--Procesamiento de datos | es_ES |
dc.subject | Análisis de datos | es_ES |
dc.subject | Prevención del delito | es_ES |
dc.subject.ocde | https://purl.org/pe-repo/ocde/ford#1.02.00 | es_ES |
dc.title | Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes | es_ES |
dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
renati.advisor.dni | 46440101 | |
renati.advisor.orcid | https://orcid.org/0000-0001-7675-6208 | es_ES |
renati.discipline | 612286 | es_ES |
renati.level | https://purl.org/pe-repo/renati/level#tituloProfesional | es_ES |
renati.type | https://purl.org/pe-repo/renati/type#tesis | es_ES |
thesis.degree.discipline | Ingeniería Informática | es_ES |
thesis.degree.grantor | Pontificia Universidad Católica del Perú. Facultad de Ciencias e Ingeniería | es_ES |
thesis.degree.level | Título Profesional | es_ES |
thesis.degree.name | Ingeniero Informático | es_ES |
Files
Original bundle
1 - 1 of 1
- Name:
- BUSTAMANTE_ALVAREZ_ GINA_EXTRACCIÓN_INFORMACIÓN_GENERACIÓN.pdf
- Size:
- 14.64 MB
- Format:
- Adobe Portable Document Format
- Description:
- Texto completo
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.61 KB
- Format:
- Item-specific license agreed upon to submission
- Description: