Modelo de regresión binaria robusta bajo un enfoque bayesiano
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Pontificia Universidad Católica del Perú
Acceso al texto completo solo para la Comunidad PUCP
Resumen
El estudio se origina con el propósito de contribuir a la comunidad científica mediante la
descripción y aplicación de modelos bayesianos capaces de mitigar el efecto distorsionador de
las variables cuantitativas sobre una variable respuesta binaria, especialmente en presencia de
valores extremos y debido a una mala especificación de la función de enlace en el predictor
lineal. El objetivo de esta investigación fue estudiar dichas propiedades de los modelos de
regresión bayesianos robustas, utilizando simulaciones y casos con datos reales para evaluar
su rendimiento comparado con un modelo tradicional.
Los modelos bayesianos robustos analizados incluyen los modelos Robit con enlace t-
Student y parámetro de forma fijo, así como una variante en la que el parámetro de forma
se estima a partir de los datos (Robit v aleatorio). Además, se examinó un modelo Robit
con función de enlace t-Student Generalizada (Robit tG) y su variante con estimación del
parámetro de forma basada en los datos observados (Robit tG v aleatorio). Estos modelos
se estimaron utilizando el método Markov Chain Monte Carlo (MCMC) y el algoritmo de
Gibbs Sampling para obtener muestras representativas de la distribución a posteriori. Las
simulaciones y estimaciones de parámetros se llevaron a cabo con R y JAGS (Just Another
Gibbs Sampler).
Los resultados obtenidos de las simulaciones y los casos de aplicación demuestran que
los modelos de regresión robusta presentan una mejor recuperación de parámetros y ajuste a
los datos en escenarios de contaminación con datos atípicos, en comparación con el modelo
Probit de referencia. Los modelos más efectivos fueron aquellos con una función de enlace
t-Student Generalizada, especialmente en situaciones de contaminación con datos atípicos.
The study aims to contribute to the scientific community by describing and applying Bayesian models capable of mitigating the distorting effect of quantitative variables on a binary response variable, especially in the presence of extreme values and due to poor specification of the link function in the linear predictor. The objective of this research was to study the properties of robust Bayesian regression models, using simulations and real data cases to evaluate their performance compared to a traditional model. The robust Bayesian models analyzed include the Robit models with a t-Student link and fixed shape parameter, as well as a variant where the shape parameter is estimated from the data (random shape Robit). Additionally, a Robit model with a Generalized t- Student link function (Robit tG) and its variant with shape parameter estimation based on observed data (random shape Robit tG) were examined. These models were estimated using the Markov Chain Monte Carlo (MCMC) method and the Gibbs Sampling algorithm to obtain representative samples of the posterior distribution. Simulations and parameter estimations were carried out with R and JAGS (Just Another Gibbs Sampler). The results obtained from the simulations and application cases show that robust regression models have better parameter recovery and data fit in scenarios with outlier contamination compared to the reference Probit model. The most effective models were those with a Generalized t-Student link function, especially in situations of outlier contamination.
The study aims to contribute to the scientific community by describing and applying Bayesian models capable of mitigating the distorting effect of quantitative variables on a binary response variable, especially in the presence of extreme values and due to poor specification of the link function in the linear predictor. The objective of this research was to study the properties of robust Bayesian regression models, using simulations and real data cases to evaluate their performance compared to a traditional model. The robust Bayesian models analyzed include the Robit models with a t-Student link and fixed shape parameter, as well as a variant where the shape parameter is estimated from the data (random shape Robit). Additionally, a Robit model with a Generalized t- Student link function (Robit tG) and its variant with shape parameter estimation based on observed data (random shape Robit tG) were examined. These models were estimated using the Markov Chain Monte Carlo (MCMC) method and the Gibbs Sampling algorithm to obtain representative samples of the posterior distribution. Simulations and parameter estimations were carried out with R and JAGS (Just Another Gibbs Sampler). The results obtained from the simulations and application cases show that robust regression models have better parameter recovery and data fit in scenarios with outlier contamination compared to the reference Probit model. The most effective models were those with a Generalized t-Student link function, especially in situations of outlier contamination.
Descripción
Palabras clave
Estadística--Modelos matemáticos, Estadística bayesiana, Análisis de regresión--Métodos de simulación
Citación
Colecciones
item.page.endorsement
item.page.review
item.page.supplemented
item.page.referenced
Licencia Creative Commons
Excepto donde se indique lo contrario, la licencia de este ítem se describe como info:eu-repo/semantics/openAccess