A comparison of missing value imputation methods applied to daily precipitation in a semi-arid and a humid region of Mexico



Document title: A comparison of missing value imputation methods applied to daily precipitation in a semi-arid and a humid region of Mexico
Journal: Atmósfera
Database: PERIÓDICA
System number: 000456559
ISSN: 0187-6236
Authors: 1
3
3
3
3
4
Institutions: 1Universidad de Guanajuato, Guanajuato. México
2Universidad Central "Marta Abreu" de Las Villas, Santa Clara, Villa Clara. Cuba
3Universidad de Guanajuato, Departamento de Ingeniería Geomática e Hidráulica, Guanajuato. México
4Universidad de La Coruña, Escuela Técnica Superior de Ingenieros de Caminos, Canales y Puertos, La Coruña. España
Year:
Volumen: 37
Country: México
Language: Inglés
Document type: Artículo
Approach: Analítico, descriptivo
Spanish abstract Los valores poco confiables o ausentes en datos climatológicos son una importante área de investigación, y existen varios métodos disponibles para completar los datos faltantes y evaluar la calidad de los mismos. Nuestro estudio tiene como objetivo comparar el rendimiento de diferentes métodos de estimación de valores faltantes diseñados explícitamente para la precipitación y datos hidrológicos. La variable climática utilizada para el análisis fue la precipitación diaria. Consideramos dos regiones climáticas y orográficas diferentes para evaluar el efecto de la altitud, régimen de precipitación y porcentaje de datos faltantes sobre el Error Absoluto Medio de los valores imputados, y realizamos una evaluación de homogeneidad en las estaciones meteorológicas. Se excluyeron del análisis las estaciones meteorológicas con más del 25% de datos faltantes. En la región semiárida, los métodos con mejor desempeño fueron el ReddPrec el cual resultó óptimo en nueve estaciones y el GCIDW en ocho, de un total de 23 estaciones, con valores promedio de MAE de 1.63 mm/día y 1.46 mm/día, respectivamente. En la región húmeda, el método GCIDW fue óptimo en ~59% de las estaciones, el EM en ~24% y el ReddPrec en ~17%, con valores promedio de MAE de ~6.0 mm/día, 6.5 mm/día y ~9.8 mm/día, respectivamente. Esta investigación realiza una valiosa contribución para identificar los métodos más adecuados para imputar la precipitación diaria en diferentes regiones climáticas de México con base en indicadores de eficiencia y evaluación de homogeneidad
English abstract Climatological data with unreliable or missing values is an important area of research, and multiple methods are available to fill in missing data and evaluate data quality. Our study aims to compare the performance of different methods for estimating missing values explicitly designed for precipitation and multipurpose hydrological data. The climate variable used for the analysis was daily precipitation. We considered two different climate and orographic regions to evaluate the effects of altitude, precipitation regime, and percentage of missing data on the Mean Absolute Error of imputed values and performed a homogeneity evaluation of meteorological stations. We excluded meteorological stations with more than 25% missing data from the analysis. In the semi-arid region, ReddPrec (optimal for nine stations) and GCIDW (optimal for eight stations) were the best-performing methods for the 23 stations, with average MAE values of 1.63 mm/day and 1.46 mm/day, respectively. In the humid region, GCIDW was optimal in ~59% of stations, EM in ~24%, and ReddPrec in ~17%, with average MAE values of ~6.0 mm/day, 6.5 mm/day, and ~9.8 mm/day, respectively. This research makes a valuable contribution to identifying the most appropriate methods to impute daily precipitation in different climatic regions of Mexico based on efficiency indicators and homogeneity evaluation
Disciplines: Geociencias
Keyword: Ciencias de la atmósfera,
Lluvia,
Datos climáticos,
Precipitación,
Datos faltantes,
México
Keyword: Atmospheric sciences,
Rainfall,
Climate data,
Precipitation,
Missing data,
Mexico
Full text: Texto completo (Ver HTML) Texto completo (Ver PDF)