Estadística
Permanent URI for this collectionhttp://98.81.228.127/handle/20.500.12404/757
Browse
Item Clusterización basada en una mixtura con distribuciones normales contaminadas multivariadas con datos incompletos: Una aplicación a la evaluación de habilidades socioemocionales(Pontificia Universidad Católica del Perú, 2023-08-31) Zegarra López, Ángel Christopher; Benites Sánchez, Luis EnriqueAunque la distribución normal es útil en una variedad de contextos, enfrenta ciertas limitaciones al modelar datos que contienen valores extremos. Estos valores pueden generar “colas” más pesadas en la distribución, en contraste con las colas más ligeras de la distribución normal. Por lo tanto, en tales circunstancias, la distribución normal contaminada se presenta como una alternativa efectiva. Este ajuste es especialmente significativo en aplicaciones como la agrupación basada en modelos. En este método, es habitual emplear distribuciones normales multivariadas como fundamento para la agrupación. No obstante, la estimación de parámetros puede verse afectada por la presencia de valores extremos. En este estudio, implementamos la distribución normal contaminada multivariada como base para la agrupación basada en modelos, tal como propone Tong y Tortora (2022). Explicamos las características del modelo y llevamos a cabo un estudio de simulación para contrastar su desempeño con la distribución normal multivariada y la distribución t multivariada. Finalmente, aplicamos un proceso de agrupación basado en una mezcla de distribuciones normales contaminadas multivariadas a un conjunto de datos reales. Estos datos se derivan de los resultados de la Evaluación de Habilidades Socioemocionales, una iniciativa implementada por el Ministerio de Educación de Perú en 2021.Item Mixtura finita de una distribución Birnbaum-Saunders basado en la familia de mixtura en parámetros de escala de distribuciones normal asimétrica(Pontificia Universidad Católica del Perú, 2021-10-06) Gavidia Pucllas, Daniel Elías; Benites Sánchez, Luis EnriqueLa presente tesis muestra la distribución mixtura de distribuciones Birnbaum-Saunders basados en mixturas de escala normal asimétrica (MF-BS-MENA). Este modelo es una extensión a la propuesta de Maehara (2018a) para datos unimodales basados en distribuciones con mixtura de escala normal asimétrica utilizada para modelar datos con percentiles extremos y altamente concentrados a la izquierda de la distribución. El modelo propuesto permite modelar datos con dos o más componentes de mixtura de distribuciones asimétricas como la t de Student asimétrica (TA), la Slash asimétrica (SLA), y la normal contaminada asimétrica (NCA). Para estimar los parámetros del modelo propuesto se presenta un método de estimación basado en el algoritmo de maximización condicional de la esperanza (una extensión del algoritmo EM). Además, se desarrollan simulaciones que muestran la precisión de las estimaciones y los errores estándar. Por último, se realizan aplicaciones con un conjunto de datos reales.Item Modelo de regresión lineal con censura basado en una distribución senh-normal/independiente: una perspectiva frecuentista(Pontificia Universidad Católica del Perú, 2021-08-20) Alonzo Huaman, Max Walter; Benites Sánchez, Luis EnriqueEn esta tesis se estudia el modelo de regresión lineal para datos censurados considerando una distribución senh-normal/independiente para los errores desde un enfoque frecuentista. Este trabajo considera la revisión de la teoría existente, la construcción del nuevo modelo, estimación de parámetros, estudios de simulación para recuperar los parámetros del modelo y la aplicación a un conjunto de datos reales.Item Modelo de regresión lineal con censura basado en una mixtura finita de una distribución normal asimétrica(Pontificia Universidad Católica del Perú, 2023-05-29) Yábar Geldres, Ingrid Alicia; Benites Sánchez, Luis EnriqueEl presente trabajo de tesis propone estudiar el modelo de regresión lineal con censura basado en una mixtura finita de una distribución normal asimétrica (NA), con adaptación a diferente número de componentes. Este enfoque permite modelar datos continuos con gran flexibilidad, acomodando simultáneamente multimodalidad, colas pesadas y asimetría, dependiendo de la estructura de los componentes de la mixtura. Se implementa un algoritmo de tipo EM analíticamente manejable y eficiente para calcular iterativamente las estimaciones de máxima verosimilitud de los parámetros, mediante aproximaciones estocásticas (SAEM). El algoritmo propuesto tiene algunas expresiones cerradas en el paso-E, por lo que la obtención de los errores estándar se da por el método Bootstrap. Asimismo, se realiza un estudio de simulación con el fin de evaluar si el método propuesto permite recuperar los parámetros del modelo mediante el uso del algoritmo SAEM. Por otro lado, se realiza la aplicación del modelo propuesto para el estudio de la participación en la fuerza laboral de las mujeres casadas usando la base de datos de la Universidad de Michigan (Mroz, 1987). Como segunda aplicación se utiliza un conjunto de datos de clientes que entraron en campaña en una entidad financiera local con el fin de estimar sus ingresos.Item Modelo de regresión lineal usando una mixtura de distribuciones senh-normal(Pontificia Universidad Católica del Perú, 2023-09-27) Palomino Ore, Roussel Simpson; Benites Sánchez, Luis EnriqueLa distribución Senohiperbólico-Normal, denominada también como una variación de la distribución Birnbaum-Saunders, surgió inicialmente para estimar el deterioro en la calidad de los materiales sujetos a estrés. Asimismo, los modelos de mixtura han suscitado considerable interés en el campo de estadística debido a que permiten lidiar con situaciones en las que el comportamiento de los errores de un modelo con ajuste lineal se aleja significativamente de la normalidad. Esta tesis aborda los dos temas mencionados mediante la presentación de un modelo de ajuste lineal usando una mixtura de distribuciones Senohiperbólico Normal o Log-Birnbaum-Saunders. Esta propuesta es una familia versátil de distribuciones de probabilidad que posibilita representar datos que presentan multimodalidad además de provenir de poblaciones heterogéneas. Para conseguir los estimadores de máxima verosimilitud se emplea el algoritmo EM con maximización condicional. Asimismo, se llevan a cabo estudios de simulación y análisis de conjuntos de datos reales para demostrar la utilidad del método propuesto. Por último, se implementa la propuesta del algoritmo y los métodos en el software R.Item Modelo de regresión no lineal basado en una mixtura de la distribución senh-normal/independiente en el error(Pontificia Universidad Católica del Perú, 2021-09-22) Ocampo Corrales, Carlos Iván; Benites Sánchez, Luis EnriqueLa distribución normal, si bien útil para explicar la distribución de muchos conjuntos de datos, a veces es inadecuada para ello. En este sentido, en muchos casos es conveniente trabajar con transformaciones de la distribución normal por ejemplo log-normal, Birnbaum- Saunders (BS) y Senh-Normal (SN). En esta tesis se presenta un modelo de regresión no lineal basado en una mixtura finita de distribuciones Senh-Normal/Independiente (SNI) en el error considerando dos casos específicos de esta distribución, SN y Senh-t-Student (SSt), respectivamente. En el contexto de regresión se plantea una metodología de estimación mediante la aplicación del algoritmo EM y también para el cálculo de los errores estándar. Se realizaron estudios de simulación para evaluar las propiedades de las estimaciones. Los resultados muestran que el modelo estima de manera satisfactoria los parámetros, más aún, evaluando el sesgo y el RSME de las estimaciones se observa que el modelo cumple con las propiedades asintóticas de los estimadores de máxima verosimilitud. Asimismo, se realizaron estudios de aplicación tanto para el modelo SN como SSt.