Modelo de predicción del rendimiento académico para el curso de nivelación de la Escuela Politécnica Nacional a partir de un modelo de aprendizaje supervisado



Título del documento: Modelo de predicción del rendimiento académico para el curso de nivelación de la Escuela Politécnica Nacional a partir de un modelo de aprendizaje supervisado
Revista: Latin-American Journal of Computing (LAJC)
Base de datos: PERIÓDICA
Número de sistema: 000456692
ISSN: 1390-9134
Autors:
1

2
Institucions: 1Escuela Politécnica Nacional, Facultad de Ciencias, Quito, Pichincha. Ecuador
2Facultad Latinoamericana de Ciencias Sociales, Departamento de Estudios Políticos, Quito, Pichincha. Ecuador
Any:
Període: Jul-Dic
Volum: 8
Número: 2
Paginació: 58-71
País: Ecuador
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español En el presente artículo se aplica un modelo de aprendizaje automático supervisado que predice la probabilidad de que un estudiante de la Escuela Politécnica Nacional apruebe el curso de nivelación. Para llevar a cabo esta tarea se describe una metodología estadística basada en gradient boosting y regresión logística donde el problema de aprendizaje se formula en términos de la minimización de la función de error mediante el método del descenso del gradiente. Para explicar la probabilidad de aprobación se toman en consideración dimensiones sugeridas por la literatura relacionadas a variables socioeconómicas, demográficas, familiares, institucionales y de desempeño académico en la postulación y en el curso de nivelación que tiene el estudiante. Los resultados del modelo de árbol de decisión muestran un nivel de precisión del 96% en el conjunto de datos de prueba, con un área bajo la curva ROC de 89.1, siendo estos niveles generalmente aceptados. Por otro lado, los resultados de la regresión logística sugieren que factores como la calificación ponderada del primer bimestre, la calificación con la que postuló, su jornada de estudios, su ubicación geográfica de origen, entre otras, afectan de una u otra manera a la probabilidad del estudiante, de aprobar el curso de nivelación
Resumen en inglés In this article, a supervised machine learning model is applied that predicts the probability that a student of the National Polytechnic School will pass the leveling course. To carry out this task, a statistical methodology based on gradient boosting and logistic regression is described where the learning problem is formulated in terms of the minimization of the error function through the gradient descent method. To explain the probability of approval, dimensions suggested by the literature related to socioeconomic, demographic, family, institutional and academic performance variables are taken into consideration in the application and in the leveling course that the student has. The results of the decision tree model show a precision level of 96% in the test data set, with an area under the ROC curve of 89.1, these levels being generally accepted. On the other hand, the results of the logistic regression suggest that factors such as the weighted qualification of the first two months, the qualification with which they applied, their study schedule, their geographical location of origin, among others, affect in one way or another the probability of the student to pass the leveling course
Disciplines Ciencias de la computación
Paraules clau: Inteligencia artificial,
Procesamiento de datos,
Programación,
Regresión logística,
Arboles de decisión,
Potenciación del gradiente,
Método del descenso del gradiente,
Rendimiento académico
Keyword: Artificial intelligence,
Data processing,
Programming,
Logistic regression,
Decision trees,
Gradient boosting machine,
Gradient descent method,
Academic performance
Text complet: Texto completo (Ver PDF)