Estadística

Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/757

Browse

Search Results

Now showing 1 - 10 of 18
  • Thumbnail Image
    Item
    Modelo de diagnóstico cognitivo longitudinal con estructura jerárquica de orden superior y atributos dependientes
    (Pontificia Universidad Católica del Perú, 2024-11-04) Villanueva Valerio, Cesar Manuel; Valdivieso Serrano, Luis Hilmar
    Diagnosticar el estado de aprendizaje de los estudiantes y determinar las habilidades subyacentes que permitan la comprensión de ciertos temas representan un desafío complejo en el ámbito educativo. Existen numerosos factores, tanto generales como específicos, que pueden influir en el desempeño individual para dominar dichas habilidades. Además, para hacerlo más desafiante, estas podrían estar interrelacionadas, formando una jerarquía en donde unas son pre requisito para acceder a otras más avanzadas. Para abordar esta complejidad, se han desarrollado modelos de diagnóstico cognitivo que permiten construir perfiles detallados de las fortalezas y debilidades de los estudiantes en relación con habilidades específicas. Estos perfiles facilitan la creación de trayectorias de aprendizaje personalizadas, diseñadas para guiar a cada estudiante hacia el dominio de los conocimientos requeridos. Las trayectorias de aprendizaje representan secuencias de habilidades que los estudiantes deben adquirir para alcanzar un objetivo educativo determinado. Estas trayectorias son dinámicas y requieren una evaluación continua para garantizar que se ajusten a las necesidades individuales de cada estudiante. En este sentido, resulta fundamental contar con modelos de diagnóstico cognitivo que sean capaces de adaptarse a los nuevos requerimientos educativos y proporcionar información precisa sobre el progreso de los estudiantes. En este estudio, se analizarán dos modelos de diagnóstico cognitivo longitudinal de orden superior secuencial de reciente desarrollo. A través de un ejercicio de simulación y una aplicación con datos reales de una prueba matemática, se evaluará el desempeño la capacidad clasificadora de estos modelos. Esta investigación contribuirá con la difusión de esta clase de modelos para promover su uso en los procesos de aprendizaje.
  • Thumbnail Image
    Item
    Modelos de transición de clases latentes
    (Pontificia Universidad Católica del Perú, 2024-10-31) Minchola Alza, Ronald Eduardo; Valdivieso Serrano, Luis Hilmar
    A pesar de que los modelos de clases latentes han recibido gran atención en la evaluación social y otros campos, estos modelos son estáticos o de corte transversal y hay poco trabajo investigativo en modelos longitudinales. Este trabajo estudia el análisis de transición de clases latentes (LTA), observando el cambio en la clasificación de clases a través del tiempo. Se desarrolla el modelo teórico para dos períodos y se extiende luego este para más de dos períodos, estudiándose sus parámetros y estimación a través del algoritmo de Esperanza- Maximización (EM). Se detallan también criterios para la selección de modelos definiendo teóricamente la razón de su uso. Finalmente, se realiza un estudio de aplicación en Mplus y en R sobre una base de datos de acoso escolar(bullying).
  • Thumbnail Image
    Item
    Modelos de regresión con mixtura de escala Gaussiana bajo regularización bayesiana
    (Pontificia Universidad Católica del Perú, 2024-09-09) Urbano Burgos, Alejandrina Margarita; Valdivieso Serrano, Luis Hilmar
    La presente tesis busca estudiar las propiedades, estimación y aplicación a dos conjuntos de datos reales de diversas técnicas de regularización bayesiana sobre un modelo de regresión lineal múltiple con mixtura de escala Gaussiana, modelo que incluye al de una regresión logística. Estas técnicas de regresión penalizada bayesiana plantean distribuciones a priori que realizan la penalización, introduciendo el concepto de esparcidad, el cual se refiere al hecho de que solo un reducido número de variables tengan valores distintos de cero en sus coeficientes de regresión; es decir, es una especie de truncamiento de coeficientes llevados a cero que produce a su vez modelos más manejables e interpretables. De particular interés en este trabajo, fue la comparación de las técnicas de regularización bajo penalización y las derivadas de introducir las prioris de Horseshoe y de Horseshoe + a los coeficientes de regresión del modelo. Mostrando en la presente tesis, de manera explícita, cómo realizar un muestreo de Gibbs para la estimación de estos modelos, detallando no solo las distribuciones condicionales completas necesarias; sino también como es posible, mediante el uso del paquete bayesreg de R, optimizar algunas de estas propuestas de muestreo.
  • Thumbnail Image
    Item
    Estimación de áreas pequeñas mediante modelos aditivos de ubicación, escala y forma aplicados a una encuesta de hogares en Perú
    (Pontificia Universidad Católica del Perú, 2024-08-09) Stehli Torrecilla, Hans; Valdivieso Serrano, Luis Hilmar
    El objetivo de la presente tesis es evaluar la robustez de los modelos aditivos de ubicación, escala y forma (GAMLSS) en una estimación en áreas pequeñas. Para ello, se realizan simulaciones estadísticas en donde se aplican estos modelos para diferentes distribuciones de la variable dependiente considerando distintos niveles de variabilidad entre las áreas, analizando la precisión de los resultados en cada caso. Asimismo, se realiza una aplicación utilizando la Encuesta Nacional de Hogares de Perú (ENAHO) del año 2017 para obtener indicadores de infraestructura de hogares y sus intervalos de confianza a nivel distrital para el departamento de Ica, además de contrastar las estimaciones con las cifras poblacionales obtenidas del Censo Nacional del mismo año. Los resultados revelan que los indicadores obtenidos mediante GAMLSS tienen un menor error cuadrático medio que aquellos estimados de manera directa, considerando el diseño muestral. Asimismo, se encuentra que los GAMLSS generan resultados más exactos respecto a los valores poblacionales, aunque ello depende de la heterogeneidad de las áreas. Este hallazgo es consistente aún bajo el supuesto de una variable dependiente de tipo dicotómica (balanceada o no balanceada) o de tipo numérica (discreta o continua). Asimismo, estas bondades son más evidentes si el tamaño de las muestras de las áreas es reducido. Finalmente, a través de la aplicación, se han obtenido estimaciones puntuales y intervalos de confianza para indicadores de acceso a saneamiento y número de habitaciones de las viviendas, correspondientes a 37 distritos del departamento de Ica.
  • Thumbnail Image
    Item
    Clasificación de riesgo para frecuencias y severidades en un seguro de automóviles usando modelos GAMLSS
    (Pontificia Universidad Católica del Perú, 2022-03-16) Hernández Bello, Diana Patricia; Valdivieso Serrano, Luis Hilmar
    En la tarificación de seguros generales, en particular en seguros de vehículos, es valioso incorporar toda la información disponible del asegurado, del bien asegurado y de los siniestros que se han presentado, con el fin de obtener modelos que consideren las variables relevantes en la estimación y así generar una prima de riesgo adecuada para el riesgo que se está analizando. Los modelos a considerar están construidos con base en las reclamaciones que ha presentado el asegurado y su estimaci´on se obtiene mediante distribuciones del número y monto de siniestros dando como resultado tarifas que incluyen recargos y descuentos en base a la experiencia siniestral, lo que se conoce como Sistema Bonus-Malus. Adicionalmente se han analizado modelos de regresión que incluyen información tanto del asegurado como del vehículo y cuya estimación de la prima de riesgo se realiza a través de la media tanto de la frecuencia como de la severidad. Sin embargo, dado que los riesgos en la cartera expuesta son heterogéneos, se plantean también modelos de regresión en los que la estimación de la frecuencia y la severidad se realiza a través de parámetros como: la media, la varianza, el sesgo y la curtosis, estos últimos son denominados modelos aditivos generalizados de localización, escala y forma (GAMLSS).
  • Thumbnail Image
    Item
    Modelos de regresión a la media con efectos mixtos para variable respuesta semicontinua
    (Pontificia Universidad Católica del Perú, 2021-09-01) Bautista Bautista, Luis Alberto; Valdivieso Serrano, Luis Hilmar
    En muchas situaciones se dispone de una variable aleatoria continua no negativa con asimetría positiva que eventualmente podría tomar el valor cero. Datos de esta naturaleza son llamados semicontinuos o cero-inflacionados y fueron tradicionalmente modelados usando el modelo de regresión de dos partes propuesto por Duan et al. (1983). En este modelo la variable respuesta sigue una distribución mixta de probabilidades conformada por una distribución de Bernoulli y una distribución continua no negativa. Una versión longitudinal de este modelo de regresión, pero que apunta a explicar la media de la variable de respuesta, fue propuesto por Smith et al. (2017). Este modelo planteaba, para su componente continua de respuesta, una distribución Log Skew Normal. El objetivo de este trabajo es estudiar un modelo alternativo al de Smith et al. (2017), que llamaremos, en general, un modelo de regresión a la media con efectos mixtos para respuestas semicontinuas, pues plantea una parametrización que permite estimar e interpretar los efectos de un conjunto de covariables sobre la media de las respuestas y no sobre la media condicionada a valores positivos. A diferencia del modelo de Smith et al. (2017), que hace uso de la distribución Log Skew Normal cero-inflacionada, nosotros modelaremos la respuesta con una distribución Gamma Generalizada cero-inflacionada. Este modelamiento, como se muestra, permite capturar de manera flexible ciertas características de los datos de respuesta, tales como, la asimetría y el comportamiento de las colas. Los resultados del estudio de simulación para el nuevo modelo mostraron un adecuado desempeño en la recuperación de sus parámetros, donde para la estimación de estos utilizamos un enfoque bayesiano y el uso de métodos MCMC Hamiltonianos. Por último, los resultados de su aplicación en el estudio longitudinal del efecto que ciertas variables podrán ejercer sobre la media de los gastos en educación de los hogares en el Perú, mostraron un mejor ajuste a los datos respecto al modelo de Smith et al. (2017), en base a los criterios de información ampliamente aplicado y de validación cruzada de Leave-one-out.
  • Thumbnail Image
    Item
    Sistema de tarifación bonus-malus para la rama de seguros de automóvil
    (Pontificia Universidad Católica del Perú, 2021-01-18) Vivanco Ortiz, Yoshi Abel; Valdivieso Serrano, Luis Hilmar
    En la actualidad, las empresas aseguradoras cuentan con productos de seguros cada vez más personalizados a las características de sus asegurados, de modo que, cada asegurado no pague el mismo monto de prima sino un monto proporcional a su comportamiento y perfil de riesgo. Una de las formas de atender esta necesidad de personalización en la tarifación es el Sistema Bonus-Malus (SBM), el cual ajusta una prima base considerando la historia de siniestros reportados por cada asegurado. En ese sentido, una historia sin siniestros crea bonificaciones (bonus) y por ende una reducción en la prima de seguro; y, una historia con siniestros genera penalizaciones (malus) y por ende un incremento en la prima de seguro. Por tanto, el objetivo de esta tesis es aplicar los modelos SBM basados en la frecuencia para un seguro de tipo vehicular. Para ello, en base a la información disponible de los asegurados, se construye un modelo de frecuencia de siniestros usando un GLM (Poisson, Binomial Negativa y sus variantes inflacionadas en ceros), cada modelo permite obtener una prima base y clases de riesgo basados en características heterogéneas. Luego, se comparan todos los modelos obtenidos para seleccionar el mejor ajuste para los datos analizados. Por u´ltimo, se aplica el SBM y se determina en qué nivel se clasifica a cada asegurado en función al número de siniestros que reporte en el periodo de análisis, de esa manera, se determina el valor de la prima ajustada para cada asegurado. En resumen, este trabajo desarrolla un SBM con información a priori y a posteriori que permite obtener primas más justas para los asegurados de un producto de seguros vehiculares, de modo que, el asegurado que presente un comportamiento sin siniestros reportados pagará menos que un asegurado que presente siniestros en el periodo evaluado.
  • Thumbnail Image
    Item
    Extensión al modelo DINA reparametrizado con covariable
    (Pontificia Universidad Católica del Perú, 2020-10-20) Sáenz Egúsquiza, Miguel Angel; Valdivieso Serrano, Luis Hilmar
    En el campo educacional, cuando los estudiantes resuelven problemas su habilidad en un tema particular puede influir en el desempeño de los mismos en un área de estudio similar pero diferente. Por ejemplo, la habilidad en ciencias podría tener un efecto en su dominio sobre las matemáticas, lo que a su vez afectará la forma en que los evaluados responden a las preguntas o ítems sobre matemáticas de una prueba. Por tanto, resulta natural examinar la relación entre el rendimiento en un área particular de estudio y el dominio de los atributos en un tema relacionado. Los modelos de diagnóstico cognitivo (CDM) proporcionan un marco ideal para realizar un análisis de este tipo, ya que clasifican a los examinados en perfiles de atributos que indican su dominio en las habilidades delimitadas permitiendo obtener información más específica con respecto a sus fortalezas y debilidades. Los CDM resuelven varias limitaciones de los métodos clásicos y los modelos de teoría de respuesta a ítems unidimensionales (TRI). Para este estudio se amplía el marco de DINA al incorporar una covariable en un modelo de DINA reparametrizado. La covariable se puede especificar en dos niveles: en el nivel inferior, afectando la forma en que los evaluados resuelven los ítems (es decir, la probabilidad de respuesta), y en el nivel superior, influenciando en el dominio de los atributos (es decir, la clasificación latente). En esta tesis, se desarrolla teóricamente el modelo indicado desde el enfoque clásico. Para la estimación desarrollaremos el método de máxima verosimilitud y el método de la moda a posteriori vía el algoritmo de Esperanza-Maximización (EM) y de Newton-Raphson. Para tal fin, se realiza 4 estudios de simulación con la finalidad de observar en primer lugar el efecto de la covariable cuando afecta simultáneamente a los ítems y a los atributos, luego cuando la covariable afecta por separado a ambos, y también cuando la covariable no los afecta. Finalmente, se muestra su aplicación en la evaluación de la prueba de admisión a una Universidad.
  • Thumbnail Image
    Item
    Modelo lineal mixto de clases latentes con respuesta ordinal y su aplicación en la medición de la religiosidad
    (Pontificia Universidad Católica del Perú, 2020-01-16) Renteria Sacha, Ivonne Mireille; Valdivieso Serrano, Luis Hilmar
    Los modelos lineales mixtos de clases latentes desarrollados por Proust-Lima, Philipps y Liquet (2017) son útiles para analizar el aspecto dinámico y la naturaleza multidimensional de un fenómeno de interés en poblaciones no necesariamente homogéneas. Estos permiten identificar las posibles clases latentes en la población bajo estudio y cómo un conjunto de covariables afecta en cada clase a la variable respuesta de interés. En esta tesis se desarrolla el modelo lineal mixto de clases latentes con variable respuesta latente y variable mani-fiesta ordinal, a través de sus dos componentes: el sub-modelo estructural y el sub-modelo de medición, que son complementados con un modelo logístico multinomial para analizar la probabilidad de pertenencia a una clase latente. El modelo se aplicó a un conjunto de datos pertenecientes al Estudio Nacional de Juventud y Religión (NSYR por las siglas en inglés “National Study of Youth and Religion”), con el fin de encontrar clases latentes en el constructo religiosidad y describir su evolución. Como resultado, se identificaron tres clases latentes con trayectorias distintas para cada caso.
  • Thumbnail Image
    Item
    Análisis bayesiano de modelos de clases latentes para variables politómicas: Confianza hacia instituciones públicas
    (Pontificia Universidad Católica del Perú, 2019-02-11) Cruz Sarmiento, Marylía Paola; Valdivieso Serrano, Luis Hilmar
    El modelo de análisis de clases latentes tiene como finalidad describir una variable no observable a través del agrupamiento de los individuos en base a sus patrones de respuestas. La estimación en este modelo se puede realizar mediante el algoritmo de Esperanza-Maximización (EM) y su desarrollo para el caso politómico se encuentra implementado en el paquete poLCA de R. Desde el punto de vista bayesiano, esta estimación ha sido hasta el momento implementada sólo para el caso de variables dicotómicas. En este trabajo, se busca extender este ultimo aporte para el caso politómico, haciendo uso del muestrador de Gibbs. La aplicación del modelo de análisis de clases latentes, bajo el enfoque bayesiano aquí desarrollado, se realizó sobre un conjunto de datos reales relacionados con la con fianza hacia 21 instituciones públicas en una encuesta para Lima Metropolitana. En general, se identificaron tres grupos de encuestados seg un sus niveles de confianza institucional, los cuales se analizaron luego en relación a otras variables.