Estimación de áreas pequeñas mediante modelos aditivos de ubicación, escala y forma aplicados a una encuesta de hogares en Perú
Abstract
El objetivo de la presente tesis es evaluar la robustez de los modelos aditivos de ubicación, escala y forma (GAMLSS) en una estimación en áreas pequeñas. Para ello, se
realizan simulaciones estadísticas en donde se aplican estos modelos para diferentes distribuciones de la variable dependiente considerando distintos niveles de variabilidad entre
las áreas, analizando la precisión de los resultados en cada caso. Asimismo, se realiza una
aplicación utilizando la Encuesta Nacional de Hogares de Perú (ENAHO) del año 2017 para obtener indicadores de infraestructura de hogares y sus intervalos de confianza a nivel
distrital para el departamento de Ica, además de contrastar las estimaciones con las cifras
poblacionales obtenidas del Censo Nacional del mismo año.
Los resultados revelan que los indicadores obtenidos mediante GAMLSS tienen un menor error cuadrático medio que aquellos estimados de manera directa, considerando el
diseño muestral. Asimismo, se encuentra que los GAMLSS generan resultados más exactos respecto a los valores poblacionales, aunque ello depende de la heterogeneidad de las
áreas. Este hallazgo es consistente aún bajo el supuesto de una variable dependiente de
tipo dicotómica (balanceada o no balanceada) o de tipo numérica (discreta o continua). Asimismo, estas bondades son más evidentes si el tamaño de las muestras de las áreas es
reducido. Finalmente, a través de la aplicación, se han obtenido estimaciones puntuales y
intervalos de confianza para indicadores de acceso a saneamiento y número de habitaciones de las viviendas, correspondientes a 37 distritos del departamento de Ica. The objective of this thesis is to evaluate the robustness of additive models of location,
scale and shape (GAMLSS), under the framework of small area estimation. To do this,
statistical simulations are carried out for different distributions of the dependent variable,
considering different levels of variability between areas and analyzing the precision of the
results in each case. Likewise, an application is carried out using the National Household
Survey of Peru (ENAHO) from 2017 to obtain household infrastructure indicators and their
confidence intervals at the district level for the department of Ica. These estimations were
later compared to their population values, retrieved from the National Census of the same
year.
The results reveal that the indicators obtained through GAMLSS have a lower mean
square error than those estimated directly by considering the sample design. Likewise, it is
found that the GAMLSS generate more accurate results with respect to population values,
although this depends on the heterogeneity of the areas. This finding is consistent even
under the assumption of a dichotomous (balanced or unbalanced) or numerical (discrete
or continuous) dependent variable. Likewise, these benefits are more evident if the sample
size of the areas is small. Finally, through the application, point estimates and confidence
intervals have been obtained for indicators of access to sanitation and number of rooms of
the households, corresponding to 37 districts of the department of Ica.
Temas
Estimación
Estadística--Modelos matemáticos
Infraestructura--Perú--Ica--Estadística
Estadística--Modelos matemáticos
Infraestructura--Perú--Ica--Estadística
Para optar el título de
Maestro en Estadística
Collections
The following license files are associated with this item: