Estadística
Permanent URI for this collectionhttps://hdl.handle.net/20.500.12404/757
Browse
14 results
Search Results
Item Modelo espacial para estudiar la distribución del monto del gasto devengado de la inversión pública a nivel provincial en el Perú(Pontificia Universidad Católica del Perú, 2025-03-03) Ocola Aguero, Kendy Brigitte; Quiroz Cornejo, Zaida JesúsEsta tesis presenta una exploración detallada y técnica de los modelos espaciales autorregresivos condicionales (CAR) y autorregresivos simultáneos (SAR) para analizar los datos de inversión pública del año 2022, específicamente para estudiar la distribución espacial del monto del gasto devengado de inversión pública en Perú. A través de una combinación de análisis teóricos y simulaciones, la investigación establece metodologías para evaluar cómo variables como la corrupción, los niveles de inversión del gobierno local, cartera priorizada y avance físico de la inversión, influencian el gasto devengado en diferentes provincias. Este estudio contribuye significativamente al entendimiento de la distribución espacial del gasto público y los factores que lo afectan, utilizando técnicas estadísticas avanzadas para mejorar la precisión y eficacia de las estimaciones de los modelos utilizados. Los resultados del análisis ofrecen perspectivas críticas sobre la gestión y asignación de fondos públicos, proporcionando una herramienta valiosa para los planificadores y responsables de la formulación de políticas públicas.Item Modelos espacio-temporales bayesianos para estudiar la incidencia de dengue en el Perú(Pontificia Universidad Católica del Perú, 2025-02-28) Caro Ferreyra, Katia Alejandra; Quiroz Cornejo, Zaida JesúsLa prevención del dengue requiere un sistema para identificar las áreas con mayor riesgo, utilizando datos epidemiológicos con estructura espacial y temporal. Los enfoques bayesianos, que integran información previa y manejan estructuras jerárquicas, proporcionan un enfoque flexible y robusto, que permite estimaciones más precisas de la incertidumbre, además de captar la correlación espacial y espacio-temporal, registrando esta variabilidad en las estimaciones de riesgo de enfermedades. Estos enfoques jerárquicos bayesianos, a menudo requieren métodos numéricos sofisticados para proporcionar estimaciones de los parámetros. En este sentido, se pueden aplicar métodos como el Monte Carlo basado en cadenas de Markov (MCMC) o la Aproximación Anidada Integrada de Laplace (INLA), siendo esta última una alternativa computacionalmente más eficiente para modelos gaussianos latentes (MGL), incluyendo modelos espaciales como el modelo jerárquico de Besag, York y Mollié (BYM), el cual puede extenderse a contextos espacio-temporales, que son de gran utilidad para evaluar el conteo de casos a lo largo del tiempo. En este marco, el presente trabajo evaluó tres modelos bayesianos: un modelo jerárquico de tendencia lineal paramétrica, un modelo jerárquico modelado dinámicamente usando un paseo aleatorio o random walk, y un modelo de tendencia dinámica no paramétrica con interacción espacio-temporal. Para mostrar el aporte de esta propuesta, los tres modelos se ajustaron a datos reales que incluyeron tanto los casos de dengue como su incidencia. En el procedimiento de selección del modelo no solo se comparó la idoneidad de los modelos, sino también de distintas distribuciones de conteo, añadiendo al análisis covariables climáticas.Item Inferencia bayesiana aproximada para el modelo multivariado block-NNGP(Pontificia Universidad Católica del Perú, 2025-01-21) Gonzales Pizango, Carlos Alberto; Quiroz Cornejo, Zaida JesúsEl estudio de las especies de aves es un excelente indicador de la biodiversidad o la productividad. Se sabe que el calentamiento global y los cambios en el uso de la tierra por parte de los humanos están afectando la abundancia de aves. En este estudio nos enfocamos en las especies Morning Dove y American Robin, las especies más abundantes en América del norte. Las abundancias de estas especies pueden estar correlacionadas entre sí y mostrar una distribución espacial similar. Por lo tanto, proponemos modelar estos datos simultáneamente a través de modelos multivariados espaciales que se basan en compartir términos comunes de efectos aleatorios espaciales gaussianos. Para mejorar la eficiencia computacional, los procesos espaciales gaussianos se aproximan a un proceso gaussiano de vecinos más cercanos por bloques (block-NNGP). El modelo geoestadístico multivariado pertenece a la clase de modelos gaussianos latentes, por ello se usó el método de aproximación de Laplace anidada integrada (INLA) que permite una inferencia bayesiana rápida. El rendimiento del modelo propuesto se demuestra a través de simulaciones y la aplicación a los datos de especies de aves.Item Estimación de la probabilidad de anemia infantil usando un modelo de regresión skew-probit(Pontificia Universidad Católica del Perú, 2024-11-20) Mestas Ventocilla, Freddy Rolando; Quiroz Cornejo, Zaida JesúsLa desnutrición crónica infantil en menores de cinco años de edad es un problema de salud pública en el Perú. Modelos estadísticos apropiados pueden ayudar a identificar variables o factores que permitan estimar la probabilidad de anemia infantil. Los modelos estadísticos para este tipo de datos binarios más conocidos son el modelo de regresión logística y probit. En esta tesis se aplican estos modelos y el modelo skew-probit, una extensión del modelo probit cuya función de enlace es asimétrica, en particular usando una versión estandarizada de la distribución skew normal. La inferencia se realiza a través del enfoque bayesiano, específicamente a través de la aproximación de Laplace integrada y anidada (INLA) debido a su eficiencia computacional. Cabe resaltar que se usa una distribución a priori penalizada compleja (PC prior) para el parámetro de sesgo de la skew normal, de esta forma se “cuantifica” la elección del modelo skew-probit respecto al modelo probit. Los resultados obtenidos para la estimar la probabilidad de anemia en niños menores de cinco años justifican la elección del modelo skew-probit.Item Modelamiento bayesiano espacial multivariado para datos de áreas(Pontificia Universidad Católica del Perú, 2024-01-19) Lopez Esquivel, Miguel Angel; Quiroz Cornejo, Zaida JesúsLas infecciones respiratorias son enfermedades que ingresan a nuestro tracto respiratorio afectando la faringe hasta a los pulmones y según la Organización mundial de salud es la causa más común de muertes en el mundo. En particular, en esta tesis se propone estudiar la relación entre la incidencia de infecciones respiratorias agudas (IRA) y la incidencia de neumonía en el Perú. Por un lado estas variables pueden estar correlacionadas, conforme aumenta el número de casos de una enfermedad también aumenta el de la otra. Por otro lado, si nos enfocamos en la incidencia de estas enfermedades a nivel provincial, esperamos que la incidencia de IRA sea similar en provincias vecinas, lo mismo esperamos que ocurra con la incidencia de neumonía. En este contexto, en esta tesis se propone estudiar la distribución espacial entre la incidencia de IRA y neumonía a nivel provincial en el Perú a través de un modelo espacial multivariado, el cual nos permite estudiar la distribución espacial de dos o más variables correlacionadas entre sí. En particular, se propone aplicar un modelo espacial multivariado con efectos aleatorios condicionales autoregresivos. Para conseguir implementar la inferencia bayesiana del modelo jerárquico espacial multivariado de forma eficiente se propone usar el método de integración aproximada anidada de Laplace (INLA).Item Modelos geoestadísticos utilizando cópulas gaussianas(Pontificia Universidad Católica del Perú, 2023-08-31) Gavidia Pantoja, Luis Alfredo; Quiroz Cornejo, Zaida JesúsLa presente tesis busca aplicar una alternativa para el modelamiento de dependencia espacial de puntos georeferenciados o también conocido como datos geoestadísticos. La metodología con la que se busca abordar la autocorrelación espacial se basa en el uso de cópulas. En particular, las cópulas gaussianas brindan un marco matemático que permite definir una función de distribución conjunta acumulada a partir de la distribución marginal de la variable respuesta cuya distribución no es normal. A través de simulaciones se estudió la bondad de ajuste de los modelos geoestadísticos usando cópulas gaussianas para datos no normales. Finalmente, se aplicaron los modelos a dos bases de datos reales: i) para detectar yacimientos petrolíferos y ii) para estimar el nivel de contaminación en el aire.Item Inferencia bayesiana aproximada del modelo espacio-temporal usando NNGP(Pontificia Universidad Católica del Perú, 2023-08-23) Benites Alfaro, Omar Eduardo; Quiroz Cornejo, Zaida JesúsLos modelos espacio-temporales nos permiten estudiar la distribución espacial de una variable en el tiempo. Por ejemplo, se puede estudiar la distribución espacial del material particulado en un país a través de los años, dado que las concentraciones de material particulado en estaciones cercanas pueden ser similares y la concentración en una estación en un año puede depender de la concentración en la misma estación el año anterior anterior. En esta tesis se propone usar un modelo espacio-temporal a través del proceso gaussiano de vecinos más cercanos. Para implementar este modelo y aplicarlo en grandes bases de datos se propone usar inferencia bayesiana a través del método de integración aproximada de Laplace (INLA). La bondad de ajuste del modelo y su eficiencia se estudia a través de simulaciones. Finalmente se aplica el modelo implementado a una base de datos reales.Item Un enfoque bayesiano para estimar las temperaturas mínimas extremas a través de un modelo geoestadístico GEV(Pontificia Universidad Católica del Perú, 2023-01-16) Guevara Alvarado, Anilda Maribel; Quiroz Cornejo, Zaida JesúsEl desarrollo sostenible de un país puede verse limitado debido a cambios graduales del clima y eventos hidrometeorológicos extremos, que afectan de manera recurrente la infraestructura, medios de vida así como las inversiones. El Perú es uno de los países más afectados por la variabilidad y cambio climático, por tanto la gestión del riesgo climático, entre ellas el estudio de temperaturas extremas, contribuye a reducir impactos socio-económicos y ambientales en las inversiones público-privadas. En este contexto, en esta tesis se propone aplicar un modelo bayesiano geoestadístico usando una distribución generalizada para valores extremos (GEV) para estimar y predecir las temperaturas mínimas extremas en el Perú en el 2012. Asimismo, dado el alto costo computacional que ameritan los modelos bayesianos espaciales, se propone usar el enfoque de ecuaciones diferenciales parciales estocásticas (SPDE) y para la estimación de los parámetros se usa el método integrado de aproximación anidada de Laplace (INLA). El modelo propuesto permite estimar las temperaturas mínimas extremas en el Perú, con el propósito de mejorar la gestión de riesgo climáticoItem Regresión beta usando cópulas gaussianas para analizar series de tiempo(Pontificia Universidad Católica del Perú, 2023-01-11) Cajavilca Gonzales, Ana Rosa; Quiroz Cornejo, Zaida JesúsEste trabajo presenta una alternativa para analizar series de tiempo que se encuentran restringidas al intervalo (0; 1). Se detalla el modelo propuesto Masarotto y Varin (2012) y Guolo y Varin (2014), el cual permite capturar los efectos producidos por covariables a través de una regresión beta y adicionalmente, con el empleo de cópulas permite modelar la dependencia temporal mediante un proceso de autorregresivo de medias móviles. Como ventaja de la aplicación de este modelo se tiene que evita la necesidad de transformar la variable dependiente, así como también evita someterla al cumplimiento de diversos supuestos como los de normalidad y estacionariedad. Además, permite diferenciar los efectos de las covariables y de la dependencia temporal, lo cual coadyuva a mejorar el análisis de los resultados. Se realizó una aplicación a la tasa de desempleo desde enero de 2003 hasta octubre de 2019 en Lima Metropolitana y debido a la distribución que presenta esta variable se usó un modelo de regresión beta usando cópulas gaussianas. Para la estimación se incluyó el logaritmo del índice del PBI, así como un componente de estacionalidad anual como covariables y para tomar en cuenta la dependencia temporal se incorporó un proceso autorregresivo de medias móviles ARMA(1; 1) a través de una cópula gaussiana.Item Approximate bayesian inference for directed acyclic graph autoregressive models(Pontificia Universidad Católica del Perú, 2022-02-02) Buendía Narváez, Julio César; Quiroz Cornejo, Zaida JesúsLa prevalencia de enfermedades epidemiológicas recolectadas en áreas geográficamente limitadas, como distritos o provincias, son cruciales para la toma de decisiones en salud pública. Usualmente esta variable respuesta presenta dependencia espacial, es decir, es similar en áreas vecinas, debido a la naturaleza de la enfermedad, clima, nivel económico y cultural, entre otras razones. En este sentido, se proponen modelos espaciales de datos áreas para identificar tendencias y factores asociados a enfermedades epidemiológicas, tomando en cuenta la dependencia espacial entre áreas geográficas. Por lo general, estos modelos ajustan a la dependencia espacial a través de efectos aleatorios derivados a través de grafos. En particular, el modelo autorregresivo de gráfico acíclico dirigido (DAGAR) se basa en un grafo acíclico dirigido y algunos efectos aleatorios \del pasado". Como consecuencia, la matriz de precisión (inversa de la covarianza) del modelo es dispersa. Este modelo tiene una interpretación intuitiva de los parámetros asociados con la dependencia espacial y se puede representar como un modelo gaussiano latente. En este contexto, en esta tesis se propone implementar el modelo DAGAR a través del método de inferencia bayesiano aproximado INLA que es determinista, bastante preciso y eficiente. Dentro de este enfoque, la estimación de datos grandes se puede realizar en segundos o minutos, y permite ajustar los datos con distribución gaussiana o no gaussiana. Finalmente, para mostrar el aporte de esta propuesta, el modelo DAGAR se ajusta a datos reales.