Modelos de regresión robusta para datos de conteo

dc.contributor.advisorBayes Rodriguez, Cristian Luis
dc.contributor.authorVillar Naccha, Christoffer Augusto
dc.date.accessioned2025-08-14T14:18:33Z
dc.date.available2025-08-14T14:18:33Z
dc.date.created2025
dc.date.issued2025-08-14
dc.description.abstractEn esta tesis se propone un nuevo modelo, denominado Regresión Binomial Negativa con Mixtura en la Dispersión (NB-H), como una alternativa robusta para el análisis de datos de conteo caracterizados por sobredispersión y presencia de valores atípicos. La propuesta se basa en la introducción de una estructura de mixtura en el parámetro de dispersión de la distribución Binomial Negativa, lo que permite que el modelo sea menos sensible a observaciones extremas, preservando así la estructura general de los datos. Se presentan dos formulaciones específicas, denominadas NB-G y NB-IG, que emplean distribuciones Gamma e Inversa Gamma, respectivamente, como componentes de mezcla. Se adopta un enfoque bayesiano para la estimación de los parámetros, utilizándose simulaciones de cadenas de Markov Monte Carlo (MCMC) implementadas en el lenguaje Stan. Se realiza un estudio de simulación para evaluar la robustez del modelo frente a diferentes escenarios de contaminación, así como dos aplicaciones prácticas con datos reales provenientes del ámbito de salud. Los resultados muestran que las variantes propuestas presentan mejor desempeño respecto al modelo de Regresión Binomial Negativa tradicional en términos de estabilidad y precisión, especialmente en presencia de observaciones atípicas. Esta investigación aporta una estrategia robusta y flexible para el modelado de datos de conteo, capaz de adaptarse a contextos con alta variabilidad y presencia de valores extremos.
dc.description.abstractThis thesis proposes a new model, referred to as Negative Binomial Regression with Mixture in the Dispersion (NB-H), as a robust alternative for analyzing count data affected by overdispersion and the presence of outliers. The proposed approach incorporates a mixture structure in the dispersion parameter of the Negative Binomial distribution, making the model less sensitive to extreme observations, thereby preserving the overall data structure. Two specific formulations are developed: NB-G and NB-IG, which use Gamma and Inverse Gamma distributions, respectively, as mixing components. A Bayesian approach is adopted for parameter estimation, using Markov Chain Monte Carlo (MCMC) simulations implemented in the Stan programming language. A simulation study is performed to evaluate the robustness of the model under various contamination scenarios, alongside two real-world applications involving health-related count data. The results show that the proposed variants outperform the traditional Negative Binomial model in terms of stability and estimation accuracy, particularly in the presence of extreme values. This research introduces a flexible and resilient strategy for modeling count data under challenging conditions of high variability and outliers.
dc.identifier.urihttp://hdl.handle.net/20.500.12404/31523
dc.language.isospa
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPE
dc.rightsinfo:eu-repo/semantics/openAccesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/2.5/pe/
dc.subjectAnálisis de regresión--Modelos matemáticos
dc.subjectEstadística robusta
dc.subjectDispersión (Matemáticas)
dc.subjectDistribución binomial negativa
dc.subject.ocdehttps://purl.org/pe-repo/ocde/ford#1.01.03
dc.titleModelos de regresión robusta para datos de conteo
dc.typeinfo:eu-repo/semantics/masterThesis
renati.advisor.dni40372640
renati.advisor.orcidhttps://orcid.org/0000-0003-0474-7921
renati.author.dni74027347
renati.discipline542037
renati.jurorValdivieso Serrano, Luis Hilmar
renati.jurorBayes Rodriguez, Cristian Luis
renati.jurorDe La Cruz Huayanay, Alex
renati.levelhttps://purl.org/pe-repo/renati/level#maestro
renati.typehttps://purl.org/pe-repo/renati/type#tesis
thesis.degree.disciplineEstadísticaes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgrado.es_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.nameMaestro en Estadísticaes_ES

Archivos

Bloque original

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
VILLAR_NACCHA_CRISTOFFER_AUGUSTO_MODELO_REGRESION.pdf
Tamaño:
1.35 MB
Formato:
Adobe Portable Document Format
Descripción:
Texto completo
Cargando...
Miniatura
Nombre:
VILLAR_NACCHA_CRISTOFFER_AUGUSTO_T.pdf
Tamaño:
9.64 MB
Formato:
Adobe Portable Document Format
Descripción:
Reporte de originalidad

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción:

Colecciones