Regresión Logística Técnica de Machine Learning para predicciones académicas



Título del documento: Regresión Logística Técnica de Machine Learning para predicciones académicas
Revista: Xikua boletín científico de la escuela superior de Tlahuelilpan
Base de datos:
Número de sistema: 000585744
ISSN: 2007-4948
Autores: 1
1
Instituciones: 1Universidad Distrital Francisco José de Caldas Bogotá Colombia,
Año:
Volumen: 12
Número: s/n
Paginación: 71-80
País: México
Idioma: Español
Resumen en inglés In this article, we use logistic regression as a machine learning technique to predict the probability that a first-semester student at the Francisco José de Caldas District University will fail or pass the calculus subject, and with what percentage.To do this, make use of the student database available in the data repository of the FJC district university, see [1].Initially, we used logistic regression using the student's entry age and the grade obtained in previous semesters, to predict the percentage with which a new student would obtain a passing grade according to the standards of the district university, which is three point zero (3.0).As a second term we use multiple logistic regression, with it we use more than two input variables and the grade obtained by the students in the previous semester. With this we predict the grade of the student with a passing percentage.Firstly, using simple logistic regression, we predict the probability that a student with a given score on the state tests (ICFES) will fail a first semester course at the FJC District University of Bogotá.For this we have used Python and the keras and tensorflow libraries. To evaluate the efficiency of our model, we have analyzed the data using: The mean square error, Mean Squere error´ (MSE), The root of the MSE, Root Mean Square Error (RMSE) and the coefficient of determination (R2).´ We have also evaluated our model using the square root of the mean square error, RMSE: Root Mean Square' Error, which measures how well a regression line fits the data points.For the management of the database, we worked on .cvs files and they were manipulated using NumPy and Pandas libraries for this purpose supplied by Python.
Resumen en español En este artículo, empleamos la regresión logística como técnica de machine learning para predecir cual es la probabilidad que un estudiante de primer semestre de la Universidad Distrital Francisco José De Caldas repruebe  o aprueba la materia de cálculo y con qué porcentaje.Para ello hacer uso de la base de datos de estudiantes disponible en el repositorio de datos de la universidad distrital FJC ver [1].Inicialmente utilizamos regresión logística utilizando la edad de ingreso del estudiante y la nota obtenida en semestres anteriores, para predecir el porcentaje con el cual un nuevo estudiante obtendría una nota aprobatoria según las normas de la universidad distrital la cual es tres punto cero (3.0).Como segundo término utilizamos regresión logística múltiple, con ella utilizamos más de dos variables de entrada y la nota obtenida por los estudiantes en el semestre anterior. Con ello predecimos la nota del estudiante con un porcentaje de aprobación.En primer término, mediante regresión logística simple, predecimos, la probabilidad de que un estudiante con determinado puntaje en las pruebas de estado (ICFES) repruebe una materia de primer semestre en la Universidad Distrital FJC de Bogotá.  Para ello hemos utilizado Python y las librerías keras y tensorflow. Para evaluar la eficiencia de nuestro modelo, hemos analizado los datos mediante: El error cuadrático medio, Mean Squere error´ (MSE), La raíz del MSE, Root Mean Square Error (RMSE) y el coeficiente de determinación (R2). también hemos evaluado nuestro modelo mediante, la raíz cuadrada del error cuadrático medio, RMSE: Root Mean Square´ Error que nos mide que tan bien se ajusta una línea de regresión´ a los puntos de datos.Para el manejo de la base de datos se trabajó sobre archivos .cvs y fueron manipulados mediante NumPy y Pandas librerías para tal fin suministradas por Python.
Palabras clave: Regresión logística simple,
Regresión logística múltiple,
Mean Squere error (MSE),
Coeficiente de determinación (R2),
Descenso del gradiente,
Estudiante
Keyword: Simple Logistic Regression,
Multiple Logistic Regression,
Mean Squere Error (MSE),
Coefficient of Determination (R2),
Gradient Descent,
Student
Texto completo: Texto completo (Ver PDF)