Estadística

Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/757

Browse

Search Results

Now showing 1 - 10 of 11
  • Thumbnail Image
    Item
    Estimación de la probabilidad de anemia infantil usando un modelo de regresión skew-probit
    (Pontificia Universidad Católica del Perú, 2024-11-20) Mestas Ventocilla, Freddy Rolando; Quiroz Cornejo, Zaida Jesús
    La desnutrición crónica infantil en menores de cinco años de edad es un problema de salud pública en el Perú. Modelos estadísticos apropiados pueden ayudar a identificar variables o factores que permitan estimar la probabilidad de anemia infantil. Los modelos estadísticos para este tipo de datos binarios más conocidos son el modelo de regresión logística y probit. En esta tesis se aplican estos modelos y el modelo skew-probit, una extensión del modelo probit cuya función de enlace es asimétrica, en particular usando una versión estandarizada de la distribución skew normal. La inferencia se realiza a través del enfoque bayesiano, específicamente a través de la aproximación de Laplace integrada y anidada (INLA) debido a su eficiencia computacional. Cabe resaltar que se usa una distribución a priori penalizada compleja (PC prior) para el parámetro de sesgo de la skew normal, de esta forma se “cuantifica” la elección del modelo skew-probit respecto al modelo probit. Los resultados obtenidos para la estimar la probabilidad de anemia en niños menores de cinco años justifican la elección del modelo skew-probit.
  • Thumbnail Image
    Item
    Modelamiento bayesiano espacial multivariado para datos de áreas
    (Pontificia Universidad Católica del Perú, 2024-01-19) Lopez Esquivel, Miguel Angel; Quiroz Cornejo, Zaida Jesús
    Las infecciones respiratorias son enfermedades que ingresan a nuestro tracto respiratorio afectando la faringe hasta a los pulmones y según la Organización mundial de salud es la causa más común de muertes en el mundo. En particular, en esta tesis se propone estudiar la relación entre la incidencia de infecciones respiratorias agudas (IRA) y la incidencia de neumonía en el Perú. Por un lado estas variables pueden estar correlacionadas, conforme aumenta el número de casos de una enfermedad también aumenta el de la otra. Por otro lado, si nos enfocamos en la incidencia de estas enfermedades a nivel provincial, esperamos que la incidencia de IRA sea similar en provincias vecinas, lo mismo esperamos que ocurra con la incidencia de neumonía. En este contexto, en esta tesis se propone estudiar la distribución espacial entre la incidencia de IRA y neumonía a nivel provincial en el Perú a través de un modelo espacial multivariado, el cual nos permite estudiar la distribución espacial de dos o más variables correlacionadas entre sí. En particular, se propone aplicar un modelo espacial multivariado con efectos aleatorios condicionales autoregresivos. Para conseguir implementar la inferencia bayesiana del modelo jerárquico espacial multivariado de forma eficiente se propone usar el método de integración aproximada anidada de Laplace (INLA).
  • Thumbnail Image
    Item
    Modelos geoestadísticos utilizando cópulas gaussianas
    (Pontificia Universidad Católica del Perú, 2023-08-31) Gavidia Pantoja, Luis Alfredo; Quiroz Cornejo, Zaida Jesús
    La presente tesis busca aplicar una alternativa para el modelamiento de dependencia espacial de puntos georeferenciados o también conocido como datos geoestadísticos. La metodología con la que se busca abordar la autocorrelación espacial se basa en el uso de cópulas. En particular, las cópulas gaussianas brindan un marco matemático que permite definir una función de distribución conjunta acumulada a partir de la distribución marginal de la variable respuesta cuya distribución no es normal. A través de simulaciones se estudió la bondad de ajuste de los modelos geoestadísticos usando cópulas gaussianas para datos no normales. Finalmente, se aplicaron los modelos a dos bases de datos reales: i) para detectar yacimientos petrolíferos y ii) para estimar el nivel de contaminación en el aire.
  • Thumbnail Image
    Item
    Inferencia bayesiana aproximada del modelo espacio-temporal usando NNGP
    (Pontificia Universidad Católica del Perú, 2023-08-23) Benites Alfaro, Omar Eduardo; Quiroz Cornejo, Zaida Jesús
    Los modelos espacio-temporales nos permiten estudiar la distribución espacial de una variable en el tiempo. Por ejemplo, se puede estudiar la distribución espacial del material particulado en un país a través de los años, dado que las concentraciones de material particulado en estaciones cercanas pueden ser similares y la concentración en una estación en un año puede depender de la concentración en la misma estación el año anterior anterior. En esta tesis se propone usar un modelo espacio-temporal a través del proceso gaussiano de vecinos más cercanos. Para implementar este modelo y aplicarlo en grandes bases de datos se propone usar inferencia bayesiana a través del método de integración aproximada de Laplace (INLA). La bondad de ajuste del modelo y su eficiencia se estudia a través de simulaciones. Finalmente se aplica el modelo implementado a una base de datos reales.
  • Thumbnail Image
    Item
    Un enfoque bayesiano para estimar las temperaturas mínimas extremas a través de un modelo geoestadístico GEV
    (Pontificia Universidad Católica del Perú, 2023-01-16) Guevara Alvarado, Anilda Maribel; Quiroz Cornejo, Zaida Jesús
    El desarrollo sostenible de un país puede verse limitado debido a cambios graduales del clima y eventos hidrometeorológicos extremos, que afectan de manera recurrente la infraestructura, medios de vida así como las inversiones. El Perú es uno de los países más afectados por la variabilidad y cambio climático, por tanto la gestión del riesgo climático, entre ellas el estudio de temperaturas extremas, contribuye a reducir impactos socio-económicos y ambientales en las inversiones público-privadas. En este contexto, en esta tesis se propone aplicar un modelo bayesiano geoestadístico usando una distribución generalizada para valores extremos (GEV) para estimar y predecir las temperaturas mínimas extremas en el Perú en el 2012. Asimismo, dado el alto costo computacional que ameritan los modelos bayesianos espaciales, se propone usar el enfoque de ecuaciones diferenciales parciales estocásticas (SPDE) y para la estimación de los parámetros se usa el método integrado de aproximación anidada de Laplace (INLA). El modelo propuesto permite estimar las temperaturas mínimas extremas en el Perú, con el propósito de mejorar la gestión de riesgo climático
  • Thumbnail Image
    Item
    Regresión beta usando cópulas gaussianas para analizar series de tiempo
    (Pontificia Universidad Católica del Perú, 2023-01-11) Cajavilca Gonzales, Ana Rosa; Quiroz Cornejo, Zaida Jesús
    Este trabajo presenta una alternativa para analizar series de tiempo que se encuentran restringidas al intervalo (0; 1). Se detalla el modelo propuesto Masarotto y Varin (2012) y Guolo y Varin (2014), el cual permite capturar los efectos producidos por covariables a través de una regresión beta y adicionalmente, con el empleo de cópulas permite modelar la dependencia temporal mediante un proceso de autorregresivo de medias móviles. Como ventaja de la aplicación de este modelo se tiene que evita la necesidad de transformar la variable dependiente, así como también evita someterla al cumplimiento de diversos supuestos como los de normalidad y estacionariedad. Además, permite diferenciar los efectos de las covariables y de la dependencia temporal, lo cual coadyuva a mejorar el análisis de los resultados. Se realizó una aplicación a la tasa de desempleo desde enero de 2003 hasta octubre de 2019 en Lima Metropolitana y debido a la distribución que presenta esta variable se usó un modelo de regresión beta usando cópulas gaussianas. Para la estimación se incluyó el logaritmo del índice del PBI, así como un componente de estacionalidad anual como covariables y para tomar en cuenta la dependencia temporal se incorporó un proceso autorregresivo de medias móviles ARMA(1; 1) a través de una cópula gaussiana.
  • Thumbnail Image
    Item
    Approximate bayesian inference for directed acyclic graph autoregressive models
    (Pontificia Universidad Católica del Perú, 2022-02-02) Buendía Narváez, Julio César; Quiroz Cornejo, Zaida Jesús
    La prevalencia de enfermedades epidemiológicas recolectadas en áreas geográficamente limitadas, como distritos o provincias, son cruciales para la toma de decisiones en salud pública. Usualmente esta variable respuesta presenta dependencia espacial, es decir, es similar en áreas vecinas, debido a la naturaleza de la enfermedad, clima, nivel económico y cultural, entre otras razones. En este sentido, se proponen modelos espaciales de datos áreas para identificar tendencias y factores asociados a enfermedades epidemiológicas, tomando en cuenta la dependencia espacial entre áreas geográficas. Por lo general, estos modelos ajustan a la dependencia espacial a través de efectos aleatorios derivados a través de grafos. En particular, el modelo autorregresivo de gráfico acíclico dirigido (DAGAR) se basa en un grafo acíclico dirigido y algunos efectos aleatorios \del pasado". Como consecuencia, la matriz de precisión (inversa de la covarianza) del modelo es dispersa. Este modelo tiene una interpretación intuitiva de los parámetros asociados con la dependencia espacial y se puede representar como un modelo gaussiano latente. En este contexto, en esta tesis se propone implementar el modelo DAGAR a través del método de inferencia bayesiano aproximado INLA que es determinista, bastante preciso y eficiente. Dentro de este enfoque, la estimación de datos grandes se puede realizar en segundos o minutos, y permite ajustar los datos con distribución gaussiana o no gaussiana. Finalmente, para mostrar el aporte de esta propuesta, el modelo DAGAR se ajusta a datos reales.
  • Thumbnail Image
    Item
    Identificación de conglomerados espaciales de acuerdo a niveles de morosidad de empresas en el Perú
    (Pontificia Universidad Católica del Perú, 2021-11-07) Tristán Gómez, Alex Edward; Quiroz Cornejo, Zaida Jesús
    El cumplimiento de las obligaciones financieras que tienen las empresas es respaldado por una correcta gestión de riesgo de crédito, esto evita problemas de liquidez y solvencia. Por ello es importante detectar los niveles de riesgo de morosidad en las empresas. La presente tesis tiene como objetivo identifi car conglomerados de provincias del Perú, en funciona de la tasa de incumplimiento de pagos, conocida también como la tasa de morosidad. Para ello se propone un modelamiento en dos niveles. En el primer nivel se usan modelos aglomerativos jerárquicos para seleccionar n conglomerados candidatos a priori, donde el número fi nal de conglomerados se escoge mediante criterios de selección de modelos. Posteriormente, en un segundo nivel, modelaremos el nivel de riesgo haciendo uso del modelo de Poisson y prioris condicionales autoregresivas en base a los conglomerados de nidos en el primer nivel e incluyendo covariables. Los modelos pueden ser reescritos como modelos Gaussianos latentes, y se puede usar inferencia bayesiana para estimar sus parámetros, específicamente a través de la aproximación de Laplace anidada integrada. Finalmente, como resultado de la aproximación se obtienen conglomerados de provincias de acuerdo a sus niveles de morosidad, permitiendo clasi ficar las provincias en conglomerado de alto, medio y bajo nivel de riesgo de morosidad.
  • Thumbnail Image
    Item
    Modelo de regresión Dirichlet bayesiano: aplicación para estimar la prevalencia del nivel de anemia infantil en centros poblados del Perú
    (Pontificia Universidad Católica del Perú, 2021-03-29) Andrade Chávez, Francisco Mauricio; Quiroz Cornejo, Zaida Jesús
    La anemia es una afección causada por un bajo nivel de hemoglobina en la sangre causada principalmente por un déficit en el consumo de hierro. En el Perú, es un problema de salud pública y nutrición principalmente en niñas y niños menores de cinco años, por ello el Instituto Nacional de Estadística (INEI) realiza una prueba para determinar anemia en niñas y niños a través de la Encuesta Demográfica y de Salud Familiar (ENDES). En esta encuesta se clasifica los niveles de anemia como severa si es menor a 7,0 g/dl, moderada si está entre 7,0 y 9,9 g/dl o leve si varía entre 10,0 y 11,9 g/dl. En este contexto, en esta tesis se propone aplicar el modelo de regresión de Dirichlet para estimar la prevalencia de los niveles de anemia infantil a nivel de centros poblados en el año 2017. Se propone estimar los parámetros usando inferencia bayesiana, a través del método Halmitoniano de Monte Carlo (HMC) usando Rstan. El modelo propuesto también permite identificar posibles factores determinantes de la prevalencia de la anemia infantil y tiene el propósito de mejorar las políticas públicas dirigidas a la reducción de la anemia en el país.
  • Thumbnail Image
    Item
    Regresión espacial cuantílica para variables acotadas entre (0,1)
    (Pontificia Universidad Católica del Perú, 2020-10-26) García Céspedes, Carlos Jeffer; Quiroz Cornejo, Zaida Jesús
    El Perú es un país emergente donde el desarrollo se centra en algunas ciudades y distritos específicos. Esto conlleva a mucha desigualdad económica por ello resulta importante dar seguimiento a la incidencia de pobreza en el país. De acuerdo al nivel de precariedad, la pobreza puede considerarse extrema o no extrema. En este contexto, estudiamos la incidencia de pobreza no extrema a través de un modelo de regresión cuantílica espacial a nivel distrital en la provincia de Lima utilizando la distribución de Kumaraswamy combinada con un efecto espacial intrínseco condicional autorregresivo (ICAR). Para tratar y evaluar la posible confusión espacial entre los efectos espaciales y las covariables de efectos fijos, se considera, también, el enfoque SPOCK (Spatial Orthogonal Centroid \K"orrection). Nuestros modelos pertenecen a la clase de modelos jerárquicos, para los cuales la inferencia se puede realizar utilizando el método de Monte Carlo Hamiltoniano. Por lo tanto, el modelo es computacionalmente factible para grandes conjuntos de datos, puede describir puntos extremos de la distribución de la incidencia de pobreza no extrema e identificar qué factores son importantes en las colas de la distribución de los datos.