Imputaciones múltiples, herramienta para la estimación de datos faltantes en la modelación de regresión



Título del documento: Imputaciones múltiples, herramienta para la estimación de datos faltantes en la modelación de regresión
Revista: Temas agrarios
Base de datos: PERIÓDICA
Número de sistema: 000432330
ISSN: 2389-9182
Autores: 1
2
Instituciones: 1Universidad La Gran Colombia, Facultad de Ingenierías, Armenia, Quindío. Colombia
2Universidad de Antioquia, Facultad de Ciencias Agrarias, Medellín, Antioquia. Colombia
Año:
Periodo: Ene-Jun
Volumen: 24
Número: 1
Paginación: 66-73
País: Colombia
Idioma: Español
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en español En los últimos años se ha apreciado un incremento en la investigación sobre problemas de datos faltantes, siendo la imputación múltiple una fundamental alternativa; donde los conjuntos de datos a menudo presentan complejidades que son actualmente difíciles de manejar de manera apropiada en el marco de probabilidad, pero relativamente simples de tratar con imputación; por esto, el presente artículo describe una serie de aspectos prácticos para aplicar dicha metodología en el caso de la modelación de captura de carbono para Colombia, con base en las bases de datos del Banco Mundial incluyendo datos faltantes alcanzando R2 de 79,30%, resaltándose que al momento de estimar dichos datos y recalcular el modelo respectivo se evidencia un mayor R2 , siendo del 94,79%, lo cual evidencia una mejora sustancial del respectivo modelo de regresión lineal múltiple como tal
Resumen en inglés In recent years there has been an increase in research on missing data problems, with multiple imputation being a fundamental alternative; where data sets often present complexities that are currently difficult to manage appropriately in the probability framework, but relatively simple to deal with imputation; For this reason, this article describes a series of practical aspects to apply this methodology in the case of carbon capture modeling for Colombia, based on the World Bank databases including missing data reaching R2 of 79.2988%, highlighting that when estimating said data and recalculating the respective model, a greater R2 is evidenced, being of 94.76901%, which evidences a substantial improvement of the respective multiple linear regression model as such
Disciplinas: Matemáticas
Palabras clave: Matemáticas aplicadas,
Bases de datos,
Revisión bibliográfica,
Análisis estadístico,
Análisis de varianza (ANOVA),
Coeficiente de determinación,
Sumas de cuadrados,
Análisis de regresión
Keyword: Applied mathematics,
Data bases,
Bibliographic review,
Statistical analysis,
Variance analysis (ANOVA),
Determination coefficient,
Squares sum,
Regression analysis
Texto completo: https://biblat.unam.mx/hevila/Temasagrarios/2019/vol24/no1/7.pdf