Spatiotemporal predictions from computational data substructures

dc.contributor.advisorAlatrista Salas, Hugo
dc.contributor.advisorNuñez del Prado Cortez, Miguel
dc.contributor.authorGalarreta Asian, Ana Paula
dc.date.accessioned2025-01-14T15:38:27Z
dc.date.created2023
dc.date.issued2025-01-14
dc.description.abstractEsta investigación explora diversas estrategias para predecir las ubicaciones y transacciones futuras de los usuarios, considerando tanto la información espacial como temporal. El estudio emplea técnicas de minería de patrones y aprendizaje profundo para mejorar las capacidades predictivas. La minería de patrones se utiliza para predecir transacciones futuras, introduciendo la innovación de aumentar cada elemento con una etiqueta de ubicación y organizar los elementos dentro de ventanas de tiempo específicas. Además, se utiliza una combinación de aprendizaje profundo con estructuras de grafos para predecir ubicaciones futuras, empleando la arquitectura Transformer para reducir los tiempos de entrenamiento. Una contribución significativa es la introducción del Spatiotemporal Patricia Trie (SPT), que ofrece una nueva estructura de datos para representar patrones frecuentes temporales y espaciales. También se presenta la métrica de similitud Normalized Spatial Itemset Similarity (NSIS), que evalúa las predicciones considerando tanto eventos específicos como sus ubicaciones asociadas. Experimentos en un conjunto de datos de banca privada demuestran el potencial del SPT para generar predicciones significativas sobre las próximas ubicaciones y categorías de compra. Además, este trabajo presenta el modelo Attention and Possible directions for TRAJectory prediction (APTraj), que aprovecha el mecanismo de autoatención de Transformer y un grafo dirigido de la red vial para predecir las futuras ubicaciones de los usuarios. También se presenta una mejora del algoritmo AP-Traj, llamada AP-Traj2. AP-Traj2 enfatiza la construcción de grafos y el preprocesamiento de secuencias, lo que resulta en tiempos de entrenamiento reducidos y una mayor precisión de predicción en cinco conjuntos de datos de ubicación distintos. Esto permite la generalización a datos de ubicación no representados previamente por un grafo, extendiendo la aplicabilidad del modelo. En general, los métodos propuestos representan avances significativos en la predicción de la actividad del usuario y sus ubicaciones.
dc.description.abstractThis research explores diverse strategies for predicting users’ future locations and transactions, considering both spatial and temporal information. The study employs pattern mining and deep learning techniques to enhance predictive capabilities. Pattern mining is utilized to forecast upcoming transactions, introducing the innovation of augmenting each item with a location tag and organizing items within specific time windows. Also, a combination of deep learning with graph structures is used to predict future locations, employing the Transformer architecture to reduce training times. A significant contribution is the introduction of the Spatiotemporal Patricia Trie (SPT), offering a novel data structure for representing temporal and spatial frequent patterns. The Normalized Spatial Itemset Similarity (NSIS) metric, which evaluates predictions by considering both specific events and their associated locations, is also presented. Experiments on a private banking dataset demonstrate SPT’s potential for generating meaningful predictions about next purchase locations and categories. In addition, this work presents the Attention and Possible directions for TRAJectory prediction (APTraj) model, which leverages the Transformer’s self-attention mechanism and a directed graph of the road network to predict users’ future whereabouts. An improvement of the AP-Traj algorithm, called AP-Traj2, is also presented. AP-Traj2 emphasizes graph construction and sequence preprocessing, resulting in reduced training times and improved prediction accuracy across five distinct location datasets. This allows generalization to location data not previously represented by a graph, extending the applicability of the model. Overall, the proposed methods represent significant advances in predictive modeling for user activity and location prediction.
dc.identifier.urihttp://hdl.handle.net/20.500.12404/29640
dc.language.isoeng
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPE
dc.rightsinfo:eu-repo/semantics/closedAccess
dc.subjectMinería de datos
dc.subjectMinería de datos--Algoritmos
dc.subjectRecuperación de la información
dc.subjectComportamiento--Análisis
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#2.00.00
dc.titleSpatiotemporal predictions from computational data substructures
dc.typeinfo:eu-repo/semantics/doctoralThesis
renati.advisor.dni23976103
renati.advisor.dni42660446
renati.advisor.orcidhttps://orcid.org/0000-0001-5252-4728
renati.advisor.orcidhttps://orcid.org/0000-0001-7997-1739
renati.author.dni46200048
renati.discipline732028
renati.jurorTeisseire , Maguelonne Isabelle Anne
renati.jurorAlatrista Salas, Hugo
renati.jurorBringay , Sandra
renati.jurorPhan , Hai
renati.jurorNunez-Del-Prado , Miguel
renati.jurorVillanueva Talavera, Edwin Rafael
renati.levelhttp://purl.org/pe-repo/renati/level#doctor
renati.typehttps://purl.org/pe-repo/renati/type#tesis
thesis.degree.disciplineIngenieríaes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgradoes_ES
thesis.degree.levelDoctoradoes_ES
thesis.degree.nameDoctor en Ingenieríaes_ES

Files

Original bundle

Now showing 1 - 2 of 2
No Thumbnail Available
Name:
GALARRETA_ASIAN_ANA_PAULA.pdf
Size:
1.18 MB
Format:
Adobe Portable Document Format
Description:
Texto completo
No Thumbnail Available
Name:
GALARRETA_ASIAN_ANA_PAULA_T.pdf
Size:
13.89 MB
Format:
Adobe Portable Document Format
Description:
Reporte de originalidad

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: