Revista: | Latin-American Journal of Computing (LAJC) |
Base de datos: | PERIÓDICA |
Número de sistema: | 000456692 |
ISSN: | 1390-9134 |
Autores: | Calva, Karen Flores, Miguel1 Porras, Hugo Cabezas Martínez, Ana2 |
Instituciones: | 1Escuela Politécnica Nacional, Facultad de Ciencias, Quito, Pichincha. Ecuador 2Facultad Latinoamericana de Ciencias Sociales, Departamento de Estudios Políticos, Quito, Pichincha. Ecuador |
Año: | 2021 |
Periodo: | Jul-Dic |
Volumen: | 8 |
Número: | 2 |
Paginación: | 58-71 |
País: | Ecuador |
Idioma: | Español |
Tipo de documento: | Artículo |
Enfoque: | Aplicado, descriptivo |
Resumen en español | En el presente artículo se aplica un modelo de aprendizaje automático supervisado que predice la probabilidad de que un estudiante de la Escuela Politécnica Nacional apruebe el curso de nivelación. Para llevar a cabo esta tarea se describe una metodología estadística basada en gradient boosting y regresión logística donde el problema de aprendizaje se formula en términos de la minimización de la función de error mediante el método del descenso del gradiente. Para explicar la probabilidad de aprobación se toman en consideración dimensiones sugeridas por la literatura relacionadas a variables socioeconómicas, demográficas, familiares, institucionales y de desempeño académico en la postulación y en el curso de nivelación que tiene el estudiante. Los resultados del modelo de árbol de decisión muestran un nivel de precisión del 96% en el conjunto de datos de prueba, con un área bajo la curva ROC de 89.1, siendo estos niveles generalmente aceptados. Por otro lado, los resultados de la regresión logística sugieren que factores como la calificación ponderada del primer bimestre, la calificación con la que postuló, su jornada de estudios, su ubicación geográfica de origen, entre otras, afectan de una u otra manera a la probabilidad del estudiante, de aprobar el curso de nivelación |
Resumen en inglés | In this article, a supervised machine learning model is applied that predicts the probability that a student of the National Polytechnic School will pass the leveling course. To carry out this task, a statistical methodology based on gradient boosting and logistic regression is described where the learning problem is formulated in terms of the minimization of the error function through the gradient descent method. To explain the probability of approval, dimensions suggested by the literature related to socioeconomic, demographic, family, institutional and academic performance variables are taken into consideration in the application and in the leveling course that the student has. The results of the decision tree model show a precision level of 96% in the test data set, with an area under the ROC curve of 89.1, these levels being generally accepted. On the other hand, the results of the logistic regression suggest that factors such as the weighted qualification of the first two months, the qualification with which they applied, their study schedule, their geographical location of origin, among others, affect in one way or another the probability of the student to pass the leveling course |
Disciplinas: | Ciencias de la computación |
Palabras clave: | Inteligencia artificial, Procesamiento de datos, Programación, Regresión logística, Arboles de decisión, Potenciación del gradiente, Método del descenso del gradiente, Rendimiento académico |
Keyword: | Artificial intelligence, Data processing, Programming, Logistic regression, Decision trees, Gradient boosting machine, Gradient descent method, Academic performance |
Texto completo: | Texto completo (Ver PDF) |