Estadística
Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/757
Browse
35 results
Search Results
Item El Modelo de Respuesta Nominal: Aplicación a datos educacionales(Pontificia Universidad Católica del Perú, 2019-07-17) Rivera Espejo, José Manuel; Tarazona Vargas, Enver GeraldThis thesis focuses its e orts on presenting and studying the Nominal Response Model or NRM (Bock, 1972, 1997), in the context of the Item Response Theory (IRT). Simulation studies are carried out to determine the quality of the recovery of the parameters of the model, under the Classic (MML) and Bayesian (MCMC) aproach and nally, the studied model was applied to an random, representative and anonymous sample of 1641 teachers from the Basic Regular Education modality of the english specialty, who were exposed to the Reading-Comprehension sub-test of the \Concurso de Nombramiento 2015". Related to the simulation, we found the bayesian method is a good substitute for the classic counterpart, because it recovers in a similarly satisfactory fashion the parameters of the items; however, the main disadvantage was that the process was between 620 to 14; 100 times slower than the classical approach, despite the special emphasis on making the MCMC processes parrallel. Related to the results of the implementation of the model on real data, the NRM: (i) it facilitates the recovery of a greater proportion of information available in the items, compared to dichotomous response models (Bock, 1972; Thissen, 1976; Levine y Drasgow, 1983; Thissen y Steinberg, 1984), (ii) it allows to nd the implicit order in initially not ordered categorical data (Samejima, 1988; Bock, 1997) and (iii) it provided relevant information for the examination of the quality of an item (Thissen et al., 1989), specially in two fronts: (a) it allowed the identi cation of useless or forced alternatives and (b) it allowed the identi cation of alternatives that could be collapsed, given that these alternatives registered a similar topics.Item El modelo de larga duración Weibull-Geométrica(Pontificia Universidad Católica del Perú, 2019-03-20) Torres Salinas, Karina Hesi; Sal y Rosas Celi, Víctor GiancarloLos modelos de larga duración son una extensión de los modelos de supervivencia tradicional y nos permiten modelar una proporción de la población que no llegan a experimentar un evento de interés, incluso después de un largo periodo de seguimiento. En este trabajo se presenta y deduce la distribución de larga duración Weibull-Geométrica y su proceso de estimación e inferencia. Se desarrolló un estudio de simulación con el un de evaluar el desempeño de las estimaciones y determinar si se recuperan los parámetros. Asimismo el modelo fue aplicado a una muestra de clientes que adquirieron y activaron una tarjeta de crédito entre enero a diciembre del año 2015 y donde el principal objetivo del análisis era entender el comportamiento del tiempo hasta la cancelación de la tarjeta de crédito del cliente. Comparamos al modelo de larga duración Weibull-Geométrica con otros modelos de larga duración, Exponencial-Geométrica y Weibull. Los resultados indican que nuestro modelo muestra un mejor ajuste en los datos.Item Análisis bayesiano de modelos de clases latentes para variables politómicas: Confianza hacia instituciones públicas(Pontificia Universidad Católica del Perú, 2019-02-11) Cruz Sarmiento, Marylía Paola; Valdivieso Serrano, Luis HilmarEl modelo de análisis de clases latentes tiene como finalidad describir una variable no observable a través del agrupamiento de los individuos en base a sus patrones de respuestas. La estimación en este modelo se puede realizar mediante el algoritmo de Esperanza-Maximización (EM) y su desarrollo para el caso politómico se encuentra implementado en el paquete poLCA de R. Desde el punto de vista bayesiano, esta estimación ha sido hasta el momento implementada sólo para el caso de variables dicotómicas. En este trabajo, se busca extender este ultimo aporte para el caso politómico, haciendo uso del muestrador de Gibbs. La aplicación del modelo de análisis de clases latentes, bajo el enfoque bayesiano aquí desarrollado, se realizó sobre un conjunto de datos reales relacionados con la con fianza hacia 21 instituciones públicas en una encuesta para Lima Metropolitana. En general, se identificaron tres grupos de encuestados seg un sus niveles de confianza institucional, los cuales se analizaron luego en relación a otras variables.Item Modelo G-DINA aplicado al diagnóstico de desórdenes mentales(Pontificia Universidad Católica del Perú, 2019-02-11) Villena Guzmán, Denisse; Tarazona Vargas, Enver GeraldActualmente, uno de los modelos de diagnóstico cognitivo (MDC) más usados es el modelo DINA. Sin embargo, este modelo presenta varias restricciones que hacen que en muchas ocasiones, no sea el que mejor se ajusta a la realidad. En ese contexto, nace una generalización del modelo DINA, denominado G-DINA (Generalized deterministic input, noisy and gate). En el presente estudio se presentan los fundamentos y propiedades del modelo G-DINA y su aplicación en un área en el que su uso todavía no es muy común: la psicología. Así, se evaluaron los resultados de una muestra de pacientes de un hospital general de Lima a los que se les aplicó el test SRQ-18 que evalúa la presencia de desórdenes mentales. Se muestra el proceso de selección del mejor modelo para cada ítem, los resultados de los parámetros obtenidos, los diagnósticos para los 10 primeros pacientes y una distribución de los perfiles de estos pacientes. Finalmente se presenta un estudio de simulación que tiene por finalidad estudiar el efecto del tamaño de muestra en la estimación de los parámetros en el contexto de la aplicación de este estudio.Item Modelo secuencial con aplicación a la medición del rendimiento estudiantil(Pontificia Universidad Católica del Perú, 2019-02-04) Mejía Campos, Luis Ángel; Tarazona Vargas, Enver GeraldEn este trabajo se presenta el Modelo Secuencial para datos politómicos ordinales de la teoría de respuesta al ítem y sus características. De forma específi ca se estudia el Modelo Secuencial Logístico de 2 parámetros (2PL-SM). La estimación de este modelo se realiza utilizando Métodos de Cadenas de Markov de Montecarlo (MCMC), los cuales fueron implementados en R y WinBUGS. Se realizó un estudio de simulación con el objetivo de estudiar la precisión en la recuperación de parámetros observándose resultados apropiados según los índices de precisión utilizados. El Modelo Secuencial en estudio fue luego aplicado a la prueba de escritura de la Evaluación Muestral 2013 del Ministerio de Educación, evaluación que fue aplicada a una muestra de 4327 estudiantes de sexto grado de primaria de todo el país. Con la aplicación del modelo a la prueba se pudo determinar que en general esta contiene ítems cuyas di ficultades son bajas y que, para los estudiantes, el enfrentarse a esta prueba no debería resultarles complicado.Item El modelo de larga duración Exponencial-Poisson(Pontificia Universidad Católica del Perú, 2018-12-03) Gonzales Rodriguez, Julia Elena; Sal y Rosas Celi, Víctor GiancarloEn esta tesis se introducir y estudiar el modelo de supervivencia de larga duración Exponencial-Poisson. Este modelo permite estudiar el tiempo hasta la ocurrencia de un evento de interés cuando se asume que existe una fracción de unidades de la población inmunes a la ocurrencia de este evento. El modelo descrito en esta tesis es un modelo de mixtura que usa la distribución Exponencial-Poisson para modelar el tiempo a la ocurrencia del evento de interés en la sub población suceptible al evento de interés. Además se plantea un modelo de regresión logística sobre la probabilidad de ser inmune al evento de interés. Se realiza un estudio de simulación en el cual a través del sesgo porcentual y cobertura se comprobó la buena performancia del modelo. Finalmente, el modelo es aplicado sobre una muestra de clientes morosos de una entidad del sistema financiero Peruano donde el evento de interés es la cancelación de dicha deuda.Item Modelo de regresión a la media simplex inflacionada para proporciones(Pontificia Universidad Católica del Perú, 2018-11-15) Chámpac Flores, Juan Carlos; Bayes Rodríguez, Cristian LuisEl presente trabajo de tesis propone el modelo de regresión a la media simplex inflacionada, que permite modelar variables aleatorias continuas limitadas en el intervalo cerrado [0; 1] al considerar un conjunto de ecuaciones de regresión para estimar la media de la respuesta y los parámetros que modelan las probabilidades de los valores extremos 0 y 1. Asimismo, se desarrolla un estudio de simulación con el fin de evaluar si el método propuesto permite recuperar los parámetros del modelo desde el punto de vista de la estadística clásica. Por otro lado, se desarrolla la aplicación del modelo para determinar el grado de dolarización de empresas que registran deudas en el Sistema Financiero, y para evaluar el desempeño del mismo, se compara contra el modelo de regresión a la media beta inflacionada. Los resultados muestran un mejor ajuste del modelo propuesto en esta tesis.Item Modelos de regresión gamma generalizada cero-inflacionada para la media con aplicación a gastos en educación(Pontificia Universidad Católica del Perú, 2018-11-13) Vásquez Beltrán, Aníbal Alcides; Valdivieso Serrano, Luis HilmarCuando los valores posibles de una variable aleatoria son continuos y no negativos, incluyendo el valor cero con probabilidad no nula, la variable es denominada semicontinua o cero-in acionada y posiblemente sea pertinente suponer que presenta una distribución mixta de probabilidades constituida por una distribución de Bernoulli para explicar si la respuesta toma el valor cero o no y una distribución continua positiva para explicar si ésta última no es cero. En el análisis de regresión, el modelo de dos partes (MDP) es tradicionalmente usado para explicar una variable semicontinua. En el MDP la respuesta presenta este tipo de distribución mixta y sus parámetros son expresados de tal manera que posibilite estimar el efecto de un conjunto de covariables sobre la media de esta respuesta condicionada a que tome valores positivos y sobre la probabilidad de que la respuesta tome el valor cero. El objetivo de la tesis es estudiar un modelo alternativo al MDP, que llamaremos modelo de regresión cero-in acionada a la media (MCIM), cuya parametrización permita estimar e interpretar efectos de covariables sobre la media total de la respuesta, en lugar de la media condicionada a valores positivos. Además, optamos por la distribución gamma generalizada (MCIM-GG) para modelar ciertas características de los valores positivos de la respuesta, tales como, por ejemplo, la asimetría positiva y la curtosis pronunciada. Estas características, junto con el exceso de valores cero, son típicas en diferentes ejemplos de variables respuestas en la Economía y la Medicina. Los resultados del estudio de simulación muestran un adecuado desempeño de las estimaciones de máxima verosimilitud del MCIM-GG bajo diferentes escenarios de nidos según porcentajes de valores ceros de la respuesta y tamaños de muestra. Por último, los resultados de la aplicación muestran que el MCIM-GG puede tener un mejor ajuste a los datos respecto al MDP-GG, así como proporcionar una más directa interpretación de los efectos de ciertas covariables sobre la media de los gastos en educación de adolescentes participantes del estudio Niños del Milenio en el Perú.Item Modelo lineal mixto conjunto de clases latentes aplicado a un conjunto de datos longitudinales del sector salud(Pontificia Universidad Católica del Perú, 2018-11-13) Neciosup Vera, Carmen Stéfany; Valdivieso Serrano, Luis HilmarLos modelos lineales mixtos conjuntos de clases latentes, propuestos por Proust-Lima et al. (2015), permiten modelar de manera conjunta un proceso longitudinal y un proceso de supervivencia, calculando también la probabilidad de pertenencia a determinadas clases latentes que puedan existir en la población en estudio. En el presente trabajo se describen los componentes que conforman este modelo, y mediante un estudio de simulación se evalúa y analiza la implementación de su estimación. El modelo se aplica finalmente a un conjunto de datos longitudinales de pacientes diagnosticados con Cáncer de Próstata, permitiéndonos la identificación de clases latentes que se asocian luego con el estadío clínico de los pacientes.Item Análisis de influencia bajo inferencia bayesiana en evaluaciones escolares de altas consecuencias(Pontificia Universidad Católica del Perú, 2018-07-30) Christiansen Trujillo, Andrés Guillermo; Bayes Rodríguez, Cristian LuisLa presente investigación estudia una metodología para la detección de observaciones atípicas mediante un análisis de influencia bajo la perspectiva de la inferencia bayesiana. Se utiliza la medida de phi-divergencia y el estimador de Monte Carlo, derivado de ésta, trabajados previamente por Peng y Dey (1995), para el cálculo de las divergencias Kullback-Leibler, distancia rectilínea y ji-cuadrado. Además, en el presente trabajo se busca realizar este análisis de influencia en evaluaciones de altas consecuencias (evaluaciones cuyos resultados tienen un alto impacto en la vida de los estudiantes o docentes). El estudio de simulación revela que es posible recuperar observaciones previamente distorsionadas como atípicas. Finalmente, se aplica la metodología a una evaluación realizada por el Ministerio de Educación. Esta aplicación revela que la metodología estudiada es capaz de identificar escuelas con resultados no esperados dadas sus condiciones y resultados anteriores.