Informática con mención en Ciencias de la Computación
Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/6357
Browse
12 results
Search Results
Item Predicción de un tiro penal de fútbol basado en la estimación de postura del jugador(Pontificia Universidad Católica del Perú, 2024-06-24) Mauricio Salazar, Josue Angel; Alatrista Salas, HugoEn este artículo se presenta una metodología innovadora para predecir un tiro penal en fútbol basado en la estimación de postura del jugador que ejecuta el disparo haciendo uso de dos herramientas de visión computacional como segmentación semántica en videos y la estimación de postura 3D mediante los métodos TAM y MMPose, respectivamente. Para ello, se construyó un corpus de videos de tiros penales y se han entrenado modelos de aprendizaje profundo para predecir la región del arco a la cual llegará el disparo. Los resultados muestran que el modelo llamado CNN 3D logra una mejor precisión con respecto a los otros modelos entrenados. Además, se ha medido la influencia de distintas partes del cuerpo con respecto a la tarea de predicción, mostrando que las piernas son las partes más influyentes. Por último, implementamos una herramienta web para el entrenamiento de porteros y jugadores de fútbol en tiros penales, ofreciendo de esta manera posibles mejoras en las tácticas de un disparo de tiro penal mediante el uso de la visión computacional.Item Generación de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidad(Pontificia Universidad Católica del Perú, 2021-05-28) Montalvo García, Peter Jonathan; Alatrista Salas, HugoLa minería de datos permite conocer patrones en grandes volúmenes de datos; pero dentro de estos datos puede haber información sensible que compromete la privacidad. En tal sentido, se han desarrollado técnicas para la minería de datos respetuosa de la privacidad, siendo la más utilizada la privacidad diferencial debido a las propiedades que otorga a los datos resultantes, de la mano de técnicas de aprendizaje profundo. Estas técnicas se han utilizado en conjuntos de datos de números escritos e imágenes, pero no en datos de georreferenciación. El presente trabajo tiene como objetivo medir la eficacia de los datos sintéticos generados a través redes generativas adversariales y privacidad diferencial en datos de georreferenciación. La generación de estos datos se hace a través de selección de datos, sanitización para la obtención de la base de datos sintéticos y evaluación a través de modelos de movilidad a partir de las trazas que sirven para medir la pérdida de información y el riesgo de divulgación. En líneas generales, los resultados demuestran que la aplicación de estas técnicas sobre datos de georreferencia da como producto un conjunto de datos sintéticos con una pérdida de información y riesgo de divulgación bajos, y se concluye que estos conjuntos de datos obtenido se puede realizar una minería de datos similar a la que se haría con los datos originales y sin comprometer información sensible.Item Recommender systems using temporal restricted sequential patterns(Pontificia Universidad Católica del Perú, 2021-04-12) Samamé Jimenez, Hilda Ana; Alatrista Salas, Hugo; Núñez del Prado Cortez, MiguelRecommendation systems are algorithms for suggesting relevant items to users. Generally, the recommendations are expressed in what will be recommended and a value representing the recommendation's relevance. However, forecasting if the user will buy the recommended item in the next day, week, or month is crucial for companies. The present study describes a process to suggest items from sequential patterns under temporal restrictions.Item Measuring the attractiveness of tourist spots through credit and debit card transactions(Pontificia Universidad Católica del Perú, 2021-03-16) Rojas Bustamante, Leibnitz Pavel; Alatrista Salas, Hugo; Núñez del Prado Cortez, MiguelTourism is an essential economic activity for some regions and countries that has been increasing its value for governments and private companies in the last years. Some researches, found in state of the art, have demonstrated the importance of knowing how tourists behave. Furthermore, several approaches have been performed to identify tourist behavior in different places worldwide using different data sets. Thus, this study’s main purpose is to identify domestic tourists using bank card transactions and define an attractiveness function for every region in the country through the Huff model. Additionally, some communities will be generated for describing tourism mobility. The results obtained in the present work reveal a new way of defining domestic tourists and a function to estimate the attractiveness level for departments in Peru.Item Metaphor identification for Spanish sentences using recurrent neural networks(Pontificia Universidad Católica del Perú, 2020-06-26) Alvarez Mouravskaia, Kevin; Alatrista Salas, HugoMetaphors are an important literary figure that is found in books or and daily use. Nowadays it is an essential task for Natural Language Processing (NLP), but the dependence of the context and the lack corpus in other languages make it a bottleneck for some tasks such as translation or interpretation of texts. We present a classification model using recurrent neural networks for metaphor identification in Spanish sentences. We tested our model and his variants on a new corpus in Spanish and compared it with the current baseline using an English corpus. Our best model reports an F-score of 52.5% for Spanish and 60.4% for English.Item Descubrimiento de patrones de movilidad urbana(Pontificia Universidad Católica del Perú, 2020-03-17) Peñaranda Arenas, Iván Darío; Alatrista Salas, HugoLa detección de patrones de movilidad es crucial para el desarrollo de políticas de planeación urbana y el diseño de estrategias de negocio. Algunos de los enfoques propuestos para llevar a cabo esta tarea usan encuestas, datos de registro en redes sociales o datos de telefonía móvil. Si bien es posible inferir mediante estos últimos el lugar de residencia de los clientes, no se puede a partir de esta información garantizar que efectivamente se realizó una compra en un establecimiento. En este trabajo se desarrolla una propuesta para el descubrimiento de patrones de movilidad urbana adaptando el análisis del enfoque de áreas comerciales, mediante la incorporación de datos de transacciones bancarias, mostrando la importancia de tomar en cuenta la categoría del negocio e incluir individuos de todas las clases sociales. Asimismo, se utilizaron diferentes métricas para determinar la atractividad comercial según la categoría a la que pertenece el negocio.Item Support system for decision making in the phenotypic Evaluation of brown swiss cattle using image processing and augmented reality(Pontificia Universidad Católica del Perú, 2019-11-27) Apumayta Lopez, Julianna Milagros; Alatrista Salas, Hugo; Nuñez del Prado, MiguelTo certify the information coming from the registered animals of different breeds and to guarantee their racial purity and contribute to the genetic improvement, we propose the development of a model based on augmented reality and support decision making for identification and automatic classification of Brown Swiss cattle. TensorFlow Object Detection API was used to detect the cow in real time. The learning transfer approach was used for training, and MobilNet pre-trained architecture was selected. MobilNet is an efficient model for mobile applications because it is small in size and fasts. The results were reflected in the development of a mobile app, which was evaluated through the automatic adjustment and calibration of the template on the cow if the animal that was focusing was or was not of the Brown Swiss breed.Item Identificación de líderes de opinión mediante el modelo PROV-DM y técnicas de minería de grafos(Pontificia Universidad Católica del Perú, 2019-09-04) Leon Payano, Mauro Antonio; Alatrista Salas, HugoEl análisis de la influencia social nos permite estudiar la manera de determinar la opinión de las personas utilizando como medio el intercambio de información. Dentro de esta disciplina, la identificación líderes de opinión tiene como finalidad identificar a las personas que ejercen un mayor nivel de influencia. La identificación de líderes de opinión se usa en campañas de marketing viral, sistemas de recomendación de productos y en sistemas de detección de anómalas en redes de telefonía móvil. Debido a que los medios sociales se han transformado en la fuente de datos más representativa y relevante para entender el comportamiento de las personas, el análisis de influencia se ha convertido en una de las tecnologías más importantes en las industrias modernas de información y servicios. Existen diversos métodos para identificar a los líderes de opinión. En este trabajo se plantea un algoritmo híbrido para cuantificar la influencia de acuerdo a atributos estáticos y de interacción de los usuarios pertenecientes a una red social. Los algoritmos híbridos requieren la representación de las interacciones de los usuarios mediante grafos. Por ello, se implementó un algoritmo de construcción, de segmentación y de visualización de grafos con el objeto de abordar los desafíos que involucra identificar y cuantificar la influencia de los usuarios en grandes redes sociales. El procedimiento fue aplicado en mensajes que tratan sobre el calentamiento global, recolectados desde la plataforma de Twitter con el objetivo de representar en un grafo, a los usuarios interesados en el tema. Los líderes de opinión seleccionados a partir del algoritmo propuesto representan mejor la influencia ganada a través del proceso de difusión. Este documento consta de 6 Capítulos: El capítulo 1 busca venir el problema y el enfoque adoptado en este trabajo. El Capítulo 2 describe los diversos conceptos, métodos, procesos y herramientas utilizados en el análisis de influencia social tanto en el presente trabajo y estudios relacionados. El Capítulo 3 describe los trabajos previos que busquen identificar líderes de opinión en grandes redes sociales. El Capítulo 4 describe el procedimiento de análisis de influencia social desarrollado. El Capítulo 5 describe los resultados obtenidos en la ejecución del procedimiento propuesto. Finalmente, el Capítulo 6 presentamos las conclusiones y recomendaciones obtenidas producto de trabajo realizado.Item Predicting market segmentation variables using Twitter following relations(Pontificia Universidad Católica del Perú, 2018-12-03) Brossard Núñez, Ian Paul; Alatrista Salas, HugoFrom the beginning, social sciences have looked to categorize people into groups that share common characteristics, to better serve the population, giving a distinguished treatment to each group. Applying this approach to the planning of business activities, we can better understand people’s needs, choosing the most favorable marketing strategies for each stratum of customers (saving effort in advertising and distribution) and maximize the level of satisfaction of each of market segment. Social Media is not a stranger to this principle: a correct segmentation will allow companies to avoid bringing content to people that are not part of their target audience, and to better respond to comments and complaints about their products and brands. However, some Social Media like Twitter still haven’t included demographic markers about their users within their marketing platforms, rendering decision-making difficult. In this paper, we demonstrate that it is possible to estimate important demographic information in Social Media by analyzing the tastes and preferences of the users (represented through the Twitter accounts they follow). We present four predictive models that allowed us to estimate the gender, age, socio-economic level and LATIR Lifestyle of a Twitter user. These models were trained using machine learning algorithmsItem Diseño de un proceso computacional basado en técnicas de minería de datos para el análisis del fenómeno de "El Niño"(Pontificia Universidad Católica del Perú, 2018-01-19) Díaz Barriga, Oscar Antonio; Alatrista Salas, HugoEl Perú es afectado recurrentemente por el fenómeno El Niño, el cual es un fenómeno climático que consiste en el aumento de la temperatura del mar en el Pacifico Ecuatorial. Este a su vez forma parte del ENSO (El Niño - Oscilación del Sur) que tiene un periodo de actuación de 2 a 7 años, con una fase cálida conocida como El Niño y una fase fría, La Niña. En la actualidad mediante un juicio experto se analizan las diversas fuentes de datos heterogéneas para poder encontrar posibles correlaciones útiles entre ellos. En el presente trabajo se propone un proceso computacional basado en técnicas de minería de datos que permita determinar la existencia de correlaciones espacio-temporales en relación a la temperatura superficial del mar y las variables meteorológicas pertenecientes a las regiones de la costa norte del Perú, en el periodo 2015 al 2016, último intervalo de tiempo en el que se presentó El Nino. Para esto se utiliza una metodología basada en KDD (Knowledge Discovery in Database), la cual está conformada por una serie de pasos como: la recolección de diferentes fuentes de datos, la integración en una base de datos explotable, limpieza y pretratamiento de los datos, creación de escenarios que permitan validar las posibles correlaciones, extracción de patrones mediante la librería SPMF y finalmente una propuesta de visualización, de los patrones encontrados, que permita comprender mejor el fenómeno. Los resultados obtenidos muestran la existencia de correlaciones espaciotemporales en las regiones del norte del Perú principalmente entre la temperatura de la superficie del mar y el caudal de los ríos de la costa, siendo estas correlaciones validadas por un experto miembro del IGP.