Aplicación de técnicas de previsión de series temporales basadas en aprendizaje de máquina para el pronóstico de la producción de principales cultivos de la Región La Libertad

Título de la revista

ISSN de la revista

Título del volumen

Editor

Pontificia Universidad Católica del Perú

Acceso al texto completo solo para la Comunidad PUCP

Resumen

El presente trabajo de investigación tuvo por objetivo comparar el desempeño predictivo de diferentes modelos de previsión de series temporales basados en aprendizaje de máquina para el pronóstico de la producción futura de cultivos con diferentes entradas de tiempo. Se seleccionó los modelos de redes neuronales recurrentes LSTM y modelos SARIMA para estimar 12 puntos temporales (12 meses), a nivel univariado (solo producción de los cultivos) y multivariado (producción de cultivos + variables exógenas: temperatura, humedad precipitación e intenciones de siembra). Para ello se tomó información histórica mensual de 20 años (2001-2020) de producción (miles tn) de cultivos de espárrago, maíz, palta y uva; así también variables exógenas. Se aplicó la estrategia de validación para series de tiempo “walk forward” para la optimización y validación de los modelos entrenados a univariado y multivariado. Los resultados experimentales mostraron que los modelos SARIMA univariado para los cultivos de esparrago, maíz y palta obtuvieron los mejores performances de RMSE y para el cultivo de uva a nivel multivariado obtuvo mejores resultados; por ende, estos modelos pueden ser usado como herramienta para estimar la producción de los 12 meses siguientes. Así mismo tener en cuenta que se pueden agregar otras variables exógenas como trabajos futuros.
The present research work aimed to compare the predictive performance of different time series forecasting models based on machine learning for forecasting future crop production with different time inputs. LSTM recurrent neural network models and SARIMA models were selected to estimate 12 time points (12 months), at univariate (crop production only) and multivariate (crop production + exogenous variables: temperature, humidity, precipitation and sowing intentions) levels. For this purpose, monthly historical information was taken for 20 years (2001-2020) on production (thousands of tons) of asparagus, corn, avocado and grape crops, as well as exogenous variables. The “walk forward” time series validation strategy was applied for the optimization and validation of the univariate and multivariate trained models. Experimental results showed that the univariate SARIMA models for the asparagus, corn and avocado crops obtained the best RMSE performances and for the grape crop at multivariate level obtained better results; therefore, these models can be used as a tool to estimate the production of the following 12 months. Also keep in mind that other exogenous variables can be added as future work.

Descripción

Palabras clave

Espárragos--Control de la producción--Perú--La Libertad, Maíz--Control de la producción--Perú--La Libertad, Palto--Control de la producción--Perú--La Libertad, Uvas--Control de la producción--Perú--La Libertad

Citación

item.page.endorsement

item.page.review

item.page.supplemented

item.page.referenced