Modelo de regresión binaria robusta bajo un enfoque bayesiano

Título de la revista

ISSN de la revista

Título del volumen

Editor

Pontificia Universidad Católica del Perú

Acceso al texto completo solo para la Comunidad PUCP

Resumen

El estudio se origina con el propósito de contribuir a la comunidad científica mediante la descripción y aplicación de modelos bayesianos capaces de mitigar el efecto distorsionador de las variables cuantitativas sobre una variable respuesta binaria, especialmente en presencia de valores extremos y debido a una mala especificación de la función de enlace en el predictor lineal. El objetivo de esta investigación fue estudiar dichas propiedades de los modelos de regresión bayesianos robustas, utilizando simulaciones y casos con datos reales para evaluar su rendimiento comparado con un modelo tradicional. Los modelos bayesianos robustos analizados incluyen los modelos Robit con enlace t- Student y parámetro de forma fijo, así como una variante en la que el parámetro de forma se estima a partir de los datos (Robit v aleatorio). Además, se examinó un modelo Robit con función de enlace t-Student Generalizada (Robit tG) y su variante con estimación del parámetro de forma basada en los datos observados (Robit tG v aleatorio). Estos modelos se estimaron utilizando el método Markov Chain Monte Carlo (MCMC) y el algoritmo de Gibbs Sampling para obtener muestras representativas de la distribución a posteriori. Las simulaciones y estimaciones de parámetros se llevaron a cabo con R y JAGS (Just Another Gibbs Sampler). Los resultados obtenidos de las simulaciones y los casos de aplicación demuestran que los modelos de regresión robusta presentan una mejor recuperación de parámetros y ajuste a los datos en escenarios de contaminación con datos atípicos, en comparación con el modelo Probit de referencia. Los modelos más efectivos fueron aquellos con una función de enlace t-Student Generalizada, especialmente en situaciones de contaminación con datos atípicos.
The study aims to contribute to the scientific community by describing and applying Bayesian models capable of mitigating the distorting effect of quantitative variables on a binary response variable, especially in the presence of extreme values and due to poor specification of the link function in the linear predictor. The objective of this research was to study the properties of robust Bayesian regression models, using simulations and real data cases to evaluate their performance compared to a traditional model. The robust Bayesian models analyzed include the Robit models with a t-Student link and fixed shape parameter, as well as a variant where the shape parameter is estimated from the data (random shape Robit). Additionally, a Robit model with a Generalized t- Student link function (Robit tG) and its variant with shape parameter estimation based on observed data (random shape Robit tG) were examined. These models were estimated using the Markov Chain Monte Carlo (MCMC) method and the Gibbs Sampling algorithm to obtain representative samples of the posterior distribution. Simulations and parameter estimations were carried out with R and JAGS (Just Another Gibbs Sampler). The results obtained from the simulations and application cases show that robust regression models have better parameter recovery and data fit in scenarios with outlier contamination compared to the reference Probit model. The most effective models were those with a Generalized t-Student link function, especially in situations of outlier contamination.

Descripción

Palabras clave

Estadística--Modelos matemáticos, Estadística bayesiana, Análisis de regresión--Métodos de simulación

Citación

Colecciones

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced

Licencia Creative Commons

Excepto donde se indique lo contrario, la licencia de este ítem se describe como info:eu-repo/semantics/openAccess