Estimación de áreas pequeñas mediante modelos aditivos de ubicación, escala y forma aplicados a una encuesta de hogares en Perú

Thumbnail Image

Date

2024-08-09

Journal Title

Journal ISSN

Volume Title

Publisher

Pontificia Universidad Católica del Perú

Abstract

El objetivo de la presente tesis es evaluar la robustez de los modelos aditivos de ubicación, escala y forma (GAMLSS) en una estimación en áreas pequeñas. Para ello, se realizan simulaciones estadísticas en donde se aplican estos modelos para diferentes distribuciones de la variable dependiente considerando distintos niveles de variabilidad entre las áreas, analizando la precisión de los resultados en cada caso. Asimismo, se realiza una aplicación utilizando la Encuesta Nacional de Hogares de Perú (ENAHO) del año 2017 para obtener indicadores de infraestructura de hogares y sus intervalos de confianza a nivel distrital para el departamento de Ica, además de contrastar las estimaciones con las cifras poblacionales obtenidas del Censo Nacional del mismo año. Los resultados revelan que los indicadores obtenidos mediante GAMLSS tienen un menor error cuadrático medio que aquellos estimados de manera directa, considerando el diseño muestral. Asimismo, se encuentra que los GAMLSS generan resultados más exactos respecto a los valores poblacionales, aunque ello depende de la heterogeneidad de las áreas. Este hallazgo es consistente aún bajo el supuesto de una variable dependiente de tipo dicotómica (balanceada o no balanceada) o de tipo numérica (discreta o continua). Asimismo, estas bondades son más evidentes si el tamaño de las muestras de las áreas es reducido. Finalmente, a través de la aplicación, se han obtenido estimaciones puntuales y intervalos de confianza para indicadores de acceso a saneamiento y número de habitaciones de las viviendas, correspondientes a 37 distritos del departamento de Ica.
The objective of this thesis is to evaluate the robustness of additive models of location, scale and shape (GAMLSS), under the framework of small area estimation. To do this, statistical simulations are carried out for different distributions of the dependent variable, considering different levels of variability between areas and analyzing the precision of the results in each case. Likewise, an application is carried out using the National Household Survey of Peru (ENAHO) from 2017 to obtain household infrastructure indicators and their confidence intervals at the district level for the department of Ica. These estimations were later compared to their population values, retrieved from the National Census of the same year. The results reveal that the indicators obtained through GAMLSS have a lower mean square error than those estimated directly by considering the sample design. Likewise, it is found that the GAMLSS generate more accurate results with respect to population values, although this depends on the heterogeneity of the areas. This finding is consistent even under the assumption of a dichotomous (balanced or unbalanced) or numerical (discrete or continuous) dependent variable. Likewise, these benefits are more evident if the sample size of the areas is small. Finally, through the application, point estimates and confidence intervals have been obtained for indicators of access to sanitation and number of rooms of the households, corresponding to 37 districts of the department of Ica.

Description

Keywords

Estimación, Estadística--Modelos matemáticos, Infraestructura--Perú--Ica--Estadística

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By

Creative Commons license

Except where otherwised noted, this item's license is described as info:eu-repo/semantics/openAccess