Estadística

Permanent URI for this collectionhttps://hdl.handle.net/20.500.12404/757

Browse

Search Results

Now showing 1 - 10 of 17

Regresión cuantílica binaria: un enfoque bayesiano basado en la distribución asimétrica de Laplace
(Pontificia Universidad Católica del Perú, 2024-02-15) Baldeon Molleda, Dante Reynaldo; Bayes Rodríguez, Cristian Luis
La regresión cuantílica es una técnica estadística que permite analizar la relación entre variables en distintos cuantiles de la distribución de la variable respuesta. No obstante, su aplicación en variables respuesta binaria puede contraintuitivo, pues la definición tradicional de cuantiles se conceptualiza para variables continuas y no tienen una interpretación directa en una variable binaria. A pesar de que una variable de respuesta binaria sólo toma dos valores y no permite una definición tradicional de cuantiles, es posible extender la regresión cuantílica para modelar los cuantiles de la variable latente subyacente a la variable de respuesta binaria. Esta variable latente es continua y permite aplicar la regresión cuantílica en contextos donde la variable de respuesta sea binaria. En este estudio, adoptamos un enfoque bayesiano para la regresión cuantílica binarios basado en la distribución asimétrica de Laplace (ALD); aplicaremos el modelo en un conjunto de datos correspondiente a resultados de descarte de pruebas COVID-19 en pacientes oncológicos y estimaremos los coeficientes de la regresión mediante el paquete bayesQR desarrollado en R.
Inferencia bayesiana en un modelo de regresión cuantílica autorregresivo
(Pontificia Universidad Católica del Perú, 2021-06-14) Quintos Choy, Manuel Alejandro; Bayes Rodríguez, Cristian Luis
El modelo de regresión cuantílica autorregresivo permite modelar el cuantil condicional de una serie de tiempo a partir de los rezagos de la serie. En el presente trabajo se presenta la estimación de este modelo desde la perspectiva bayesiana asumiendo que los errores se distribuyen según la distribución asimétrica de Laplace (ALD). Luego, el proceso de generación de muestras de la distribución a posteriori es simplificado utilizando una representación estocástica de la ALD propuesta por Kotz et al. (2001) y el algoritmo de datos aumentados de Tanner y Wong (1987), siguiendo la propuesta de Kozumi y Kobayashi (2011), así como las adaptaciones para el modelamiento de series de tiempo de Cai et al. (2012) y Liu y Luger (2017). Los estudios de simulación demuestran que el supuesto sobre la distribución del término error no es limitante para estimar el cuantil condicional de series de tiempo con otras distribuciones. El modelo es aplicado en la predicción del Valor en Riesgo (VaR) en la serie de tiempo de los retornos diarios de la tasa de cambio de PEN a USD, y sus resultados son comparados con las predicciones obtenidas por las metodologías RiskMetrics, GARCH(1,1) y CAVIaR. Al respecto, la evidencia numérica permite concluir que el modelo QAR es una alternativa válida para estimar el VaR.
Modelo de regresión semiparamétrico robusto
(Pontificia Universidad Católica del Perú, 2021-05-11) Esquivel Segura, Henry John; Bayes Rodríguez, Cristian Luis
El presente trabajo de tesis presenta un modelo de regresión semiparamétrico con errores t-Student, que permite estudiar el comportamiento de una variable dependiente dado un conjunto de variables explicativas cuando los supuestos de linealidad y normalidad no se cumplen. La estimación de los parámetros se realiza bajo el enfoque bayesiano a través del algoritmo de Gibbs. En el estudio de simulación se observa que el modelo propuesto es más robusto ante la presencia de valores atípicos que el usual modelo regresión semiparamétrico normal. Asimismo se presenta una aplicación con datos reales para ilustrar esta característica.
Modelamiento del tiempo a la ocurrencia de un evento con tiempos discretos
(Pontificia Universidad Católica del Perú, 2021-01-18) Huertas Quispe, Anthony Enrique; Bayes Rodríguez, Cristian Luis
En este trabajo de tesis, se plantea estudiar el tiempo a la ocurrencia de un evento en un proceso discreto. Para ello, se considera un modelo mixtura de fracción de cura sobre una población segmentada en dos tipos de individuos: sujetos curados, o también denominados sobrevivientes a largo plazo, haciendo referencia a aquellos sujetos que no alcanzarán el evento de interés en estudio; y sujetos no curados, o también denominados sujetos susceptibles, quienes en un tiempo específico, experimentarán dicho evento de interés. Los objetivos principales de esta tesis, son el de estimar la fracción de cura, la cual está definida como la proporción de individuos curados al final del estudio, y estimar el tiempo de falla para los individuos susceptibles, entendiéndose como el tiempo a la ocurrencia del evento. Este análisis se llevará a cabo con la presencia de covariables y datos censurados, siendo la simulación e inferencia de los datos efectuados vía el software estadístico R, en donde los procesos de simulación abordarán distintos escenarios para evaluar la performance del modelo propuesto.
Métodos de selección de variables bajo el enfoque bayesiano para el modelo lineal normal
(Pontificia Universidad Católica del Perú, 2021-01-18) Blas Oyola, Sthip Frank; Bayes Rodríguez, Cristian Luis
En muchos casos prácticos, al realizar un análisis de regresión, se cuenta con un gran número de potenciales variables explicativas de las cuáles sólo algunas serán importantes para explicar la variable respuesta. Por lo tanto, un problema importante para la construcción de un modelo de regresión es encontrar un adecuado conjunto de variables explicativas. A los métodos que lidian con este problema se les denomina métodos de selección de variables. En el presente proyecto de tesis, se estudiarán tres métodos de selección de variables bajo inferencia bayesiana para el modelo de regresión lineal normal los cuales fueron propuestos por George y McCulloch (1993), Kuo y Mallick (1998) y Dellaportas et al. (2002). Estos métodos, a diferencia de los métodos tradicionales, consideran la selección de variables dentro del mismo modelo, por ejemplo, introduciendo variables latentes que indiquen la presencia o ausencia de una variable explicativa. Se realizaron comparaciones de estos métodos bayesianos con los métodos Lasso y Stepwise por ser los más tradicionales. A través de un estudio con datos simulados, en diversos escenarios se observa que los métodos bayesianos permiten una adecuada selección de las variables explicativas. Adicionalmente se presentan los resultados de una aplicación con datos reales.
Jointly modelling of cluster dependent pro les of fractional and binary variables from a Bayesian point of view
(Pontificia Universidad Católica del Perú, 2020-10-27) Cortés Tejada, Fernando Javier; Bayes Rodríguez, Cristian Luis
En la presente tesis se proponen modelos de clasificación basados en regresiones beta inflacionadas cero-uno con efectos mixtos para modelar perfiles longitudinales de variables fraccionarias mixtas y variables binarias de forma conjunta con formación de clústeres. Las distintas parametrizaciones de los modelos propuestos permiten modelar distintos efectos, como modelar directamente la media marginal a través de covariables e interpretar fácilmente su efecto sobre ella o modelar la media condicional y las probabilidades de inflación de forma separada. Además, se forman clústeres de grupos de individuos con perfiles longitudinales similares a través de una variable latente, asumiendo que las variables respuesta siguen un modelo de mixtura finita. Debido a la complejidad de los modelos, los parámetros se estiman desde un punto de vista bayesiano, a partir de simulaciones MCMC utilizando el software JAGS en R. Se prueban los modelos propuestos sobre diferentes bases de datos simulados para medir el desempeño de los mismos y se comparan con otros modelos a fin de verificar cual ajusta mejor los perfiles longitudinales de variables fraccionarias mixtas y variables binarias. Por último, se aplican los modelos propuestos a datos reales de un banco peruano, con información del ratio de uso de tarjetas de crédito en el periodo de un año, estado de default del cliente y otras covariables correspondientes al cliente poseedor de la tarjeta, con el objetivo de obtener clústeres de individuos con similar ratio de uso de tarjeta de crédito y relacionarlos con la probabilidad de caer en default que presenta cada grupo.
Modelo de regresión a la media simplex inflacionada para proporciones
(Pontificia Universidad Católica del Perú, 2018-11-15) Chámpac Flores, Juan Carlos; Bayes Rodríguez, Cristian Luis
El presente trabajo de tesis propone el modelo de regresión a la media simplex inflacionada, que permite modelar variables aleatorias continuas limitadas en el intervalo cerrado [0; 1] al considerar un conjunto de ecuaciones de regresión para estimar la media de la respuesta y los parámetros que modelan las probabilidades de los valores extremos 0 y 1. Asimismo, se desarrolla un estudio de simulación con el fin de evaluar si el método propuesto permite recuperar los parámetros del modelo desde el punto de vista de la estadística clásica. Por otro lado, se desarrolla la aplicación del modelo para determinar el grado de dolarización de empresas que registran deudas en el Sistema Financiero, y para evaluar el desempeño del mismo, se compara contra el modelo de regresión a la media beta inflacionada. Los resultados muestran un mejor ajuste del modelo propuesto en esta tesis.
Análisis de influencia bajo inferencia bayesiana en evaluaciones escolares de altas consecuencias
(Pontificia Universidad Católica del Perú, 2018-07-30) Christiansen Trujillo, Andrés Guillermo; Bayes Rodríguez, Cristian Luis
La presente investigación estudia una metodología para la detección de observaciones atípicas mediante un análisis de influencia bajo la perspectiva de la inferencia bayesiana. Se utiliza la medida de phi-divergencia y el estimador de Monte Carlo, derivado de ésta, trabajados previamente por Peng y Dey (1995), para el cálculo de las divergencias Kullback-Leibler, distancia rectilínea y ji-cuadrado. Además, en el presente trabajo se busca realizar este análisis de influencia en evaluaciones de altas consecuencias (evaluaciones cuyos resultados tienen un alto impacto en la vida de los estudiantes o docentes). El estudio de simulación revela que es posible recuperar observaciones previamente distorsionadas como atípicas. Finalmente, se aplica la metodología a una evaluación realizada por el Ministerio de Educación. Esta aplicación revela que la metodología estudiada es capaz de identificar escuelas con resultados no esperados dadas sus condiciones y resultados anteriores.
Inferencia bayesiana en el modelo de regresión beta rectangular
(Pontificia Universidad Católica del Perú, 2018-05-07) Calderón Pozo, Francisco German; Bayes Rodríguez, Cristian Luis
Se conoce que el modelo lineal normal no es apropiado para situaciones en la que la variable respuesta es una proporción que solo toma valores en un rango limitado (0; 1), pues, se pueden obtener valores ajustados para la variable de inter es que exceden sus límites inferior y superior. Ante dicha situación, una propuesta es utilizar la distribución beta ya que es bastante flexible para modelar proporciones. Este modelo de regresión, sin embargo, puede ser influenciado por la presencia de valores atípicos o extremos. Debido a ello, se ha propuesto en la literatura, un modelo de mayor robustez llamado modelo de regresión beta rectangular, el cual permite una mayor incidencia de tales valores. El objetivo general de la tesis es estudiar las propiedades, estimar y aplicar a un conjunto de datos reales el modelo de regresión beta rectangular desde el punto de vista de la estadística bayesiana. Para cumplir con el objetivo planteado, se estudian las características y propiedades de las distribuciones beta y beta rectangular. Luego, se desarrolla el análisis bayesiano del modelo de regresión beta rectangular considerando las distribuciones a priori y a posteriori, los criterios de selección de modelos y simulaciones de Montecarlo v a cadenas de Markov. También, se realizan estudios de simulación para demostrar que el nuevo modelo es m as robusto que el modelo de regresión beta. Adicionalmente, se presenta una aplicación para mostrar la utilidad del modelo de regresión beta rectangular.
Estimación bayesiana de efectos de red: el modelo Logit mixto
(Pontificia Universidad Católica del Perú, 2017-10-02) Chahuara Vargas, Paulo Roberto; Bayes Rodríguez, Cristian Luis
Los efectos o externalidades de red son factores que pueden condicionar las decisiones de contratación de los consumidores en favor de empresas ya establecidas y en contra de los nuevos competidores, pudiendo limitar la competencia efectiva y potencial de los mercados, en especial, en aquellas industrias donde el número de empresas es bajo y la entrada de nuevos competidores es poco frecuente. Por ello, es importante verificar su existencia y la magnitud de sus efectos sobre las decisiones de compra de los consumidores con el objetivo de justificar o establecer medidas que impulsen una competencia más equilibrada entre las empresas. Además, teniendo en consideración que los consumidores pueden tener cierto grado de heterogeneidad en sus comportamientos de adquisición, también resulta relevante estudiar el grado de diferenciación de los efectos de red entre los consumidores a fin de mejorar las políticas que fomenten la competencia. Este trabajo tiene por objetivo estimar un modelo logit mixto bajo el enfoque de la inferencia bayesiana, para estudiar empíricamente la existencia y heterogeneidad de los efectos de red sobre las decisiones de contratación de los consumidores en la industria de telefonía móvil peruana. El análisis se hace con base a una muestra que combina información de la Encuestas Residencial de Servicios de Telecomunicaciones (ERESTEL) del a˜no 2015 e información de las empresas operadoras del servicio de telefonía móvil. Los resultados de las estimaciones realizadas sugieren que los efectos de red tendrían un condicionamiento importante sobre las decisiones de contración del servicio de telefonía móvil, además de presentar un grado de heterogeneidad estadísticamente significativo en la magnitud de sus efectos.

Estadística

Browse

Filters

Settings

Sort By

Results per page

Search Results