Estadística
Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/757
Browse
6 results
Search Results
Item Endpoint-inflated beta-binomial regression for correlated count data(Pontificia Universidad Católica del Perú, 2021-03-29) Fazio Luna, Boris Manuel; Sal y Rosas Celi, Víctor GiancarloEl modelo de regresión binomial con in acción en los extremos permite modelar datos de conteo acotados en los que una alta proporción de las observaciones se encuentra en los extremos. Extendemos el modelo considerando una función de enlace de logit ordenado, la cual aprovecha la información de orden implícita en las probabilidades de in acción y exploramos el uso de efectos aleatorios y marginalización para manejar la presencia de observaciones repetidas. Empleamos un conjunto de datos previamente analizado en la literatura mediante un modelo de regresión binomial con in acción en los extremos que emplea el enlace softmax para mostrar el mejor ajuste logrado por nuestro modelo.Item Modelo de supervivencia de larga duración con riesgos proporcionales y estimación del riesgo base vía splines: modelamiento de abandono de seguros(Pontificia Universidad Católica del Perú, 2021-01-12) Mattos Galarza, Hector; Sal y Rosas Celi, Víctor GiancarloLos modelos de supervivencia, aquellos que tratan de describir el tiempo a la ocurrencia de uno o más eventos, han demostrado tener gran versatilidad para poder modelar distintos tipos de eventos y un alcance mayor al que inicialmente se propuso. Su aplicación varía desde el área de la medicina hasta usos en actividades financieras como análisis de riesgos de activos, entre otros. Este trabajo tiene como motivación el análisis del tiempo de permanencia de un cliente con contrato de póliza de seguros. En esta aplicación, solo una fracción de los clientes son susceptibles a la terminación del contrato y, en este sentido, se requiere que el modelo cuente con la flexibilidad de asumir que no todos los clientes son susceptibles al evento de interés. En este trabajo, se propone un modelo de larga duración asumiendo un modelo de riesgos proporcionales para los clientes susceptibles de abandono y donde la función de riesgo basal de este último se modela vía funciones de splines monótonas. Este trabajo empieza con la definición del modelo, el proceso de estimación de parámetros, escenarios de simulación donde se evalúa el desempeño del proceso de estimación e inferencia y finalmente una aplicación para estudiar los factores asociados con el abandono de clientes en una compañía de seguros en el Perú.Item El modelo de larga duración Weibull-Geométrica(Pontificia Universidad Católica del Perú, 2019-03-20) Torres Salinas, Karina Hesi; Sal y Rosas Celi, Víctor GiancarloLos modelos de larga duración son una extensión de los modelos de supervivencia tradicional y nos permiten modelar una proporción de la población que no llegan a experimentar un evento de interés, incluso después de un largo periodo de seguimiento. En este trabajo se presenta y deduce la distribución de larga duración Weibull-Geométrica y su proceso de estimación e inferencia. Se desarrolló un estudio de simulación con el un de evaluar el desempeño de las estimaciones y determinar si se recuperan los parámetros. Asimismo el modelo fue aplicado a una muestra de clientes que adquirieron y activaron una tarjeta de crédito entre enero a diciembre del año 2015 y donde el principal objetivo del análisis era entender el comportamiento del tiempo hasta la cancelación de la tarjeta de crédito del cliente. Comparamos al modelo de larga duración Weibull-Geométrica con otros modelos de larga duración, Exponencial-Geométrica y Weibull. Los resultados indican que nuestro modelo muestra un mejor ajuste en los datos.Item El modelo de larga duración Exponencial-Poisson(Pontificia Universidad Católica del Perú, 2018-12-03) Gonzales Rodriguez, Julia Elena; Sal y Rosas Celi, Víctor GiancarloEn esta tesis se introducir y estudiar el modelo de supervivencia de larga duración Exponencial-Poisson. Este modelo permite estudiar el tiempo hasta la ocurrencia de un evento de interés cuando se asume que existe una fracción de unidades de la población inmunes a la ocurrencia de este evento. El modelo descrito en esta tesis es un modelo de mixtura que usa la distribución Exponencial-Poisson para modelar el tiempo a la ocurrencia del evento de interés en la sub población suceptible al evento de interés. Además se plantea un modelo de regresión logística sobre la probabilidad de ser inmune al evento de interés. Se realiza un estudio de simulación en el cual a través del sesgo porcentual y cobertura se comprobó la buena performancia del modelo. Finalmente, el modelo es aplicado sobre una muestra de clientes morosos de una entidad del sistema financiero Peruano donde el evento de interés es la cancelación de dicha deuda.Item Estimation of the disease prevalence when diagnostic tests are subject to classification error: bayesian approach(Pontificia Universidad Católica del Perú, 2017-02-02) Gutiérrez Ayala, Evelyn Patricia; Sal y Rosas Celi, Víctor GiancarloLa estimación de la prevalencia de una enfermedad, la cual es definida como el número de casos con la enfermedad en una población dividida por el número de elementos en ésta, es realizado con gran precisión cuando existen pruebas 100% exactas, también llamadas gold standard. Sin embargo, en muchos casos, debido a los altos costos de las pruebas de diagnóstico o limitaciones de tecnología, la prueba gold standard no existe y debe ser reemplazada por una o más pruebas diagnósticas no tan caras pero con bajos niveles de sensibilidad o especificidad. Este estudio está enfocado en el estudio de dos enfoques bayesianos para la estimación de prevalencia cuando no es factible tener resultados de una prueba 100% exacta. El primero es un modelo con dos parámetros que toman en cuenta la asociación entre los resultados de las pruebas. El segundo es un enfoque que propone el uso del Bayesian Model Averaging para combinar los resultados de cuatro modelos donde cada uno de estos tiene suposiciones diferentes sobre la asociación entre los resultados de las pruebas diagnósticas. Ambos enfoques son estudiados mediante simulaciones para evaluar el desempeño de estos bajo diferentes escenarios. Finalmente estas técnicas serán usadas para estimar la prevalencia de enfermedad renal crónica en el Perú con datos de un estudio de cohortes de CRONICAS (Francis et al., 2015).Item An application of discrete time survival models to analyze student dropouts at a private university in Peru(Pontificia Universidad Católica del Perú, 2016-06-20) Pebes Trujillo, Miguel Raúl; Sal y Rosas Celi, Víctor GiancarloDiscrete-time survival models are discussed and applied to the study of which factors are associated with student dropouts at a private university in Lima, Per_u. We studied the characteristics of 26; 790 incoming students enrolled between 2004 and 2012 in all the under-graduate programs at the University. The analysis include the estimation of the survival and hazard functions using the Kaplan-Meier method and the _tting of parametric models using the Cox proportional hazards regression and the Logistic regression for survival analysis, this last one, in order to include time varying variables as predictors. During the period of analysis, the cumulative probability of remain at the University after _ve years was 73.7% [95% CI: 73.1% - 74.4%]. In any period the hazard is greater than 4.4% and this highest value is reached in the 3rd semester. In a multivariate analysis, we found that academic factors (area of study, type of admission, standardized academic performance index, and the percentage of passed credits); economic factors (type of residence, and payment scale); and sociodemographic factors (mother education level, indicators of whether or not parents are alive, and the age of the student) were associated with the risk of dropout.