Revista: | Innovación y software |
Base de datos: | |
Número de sistema: | 000565906 |
ISSN: | 2708-0935 |
Autores: | Pacori Paucar, Crhistian Ziegler1 Mayta Condori, Moises Enrique1 Quispe Sanomamani, Luis Fernando1 Montana Neyra, Diego Gustavo1 |
Instituciones: | 1Universidad Nacional de San Agustín, |
Año: | 2024 |
Volumen: | 5 |
Número: | 1 |
Paginación: | 141-155 |
País: | Perú |
Idioma: | Español |
Resumen en inglés | In this project, a differentiation is made between people through different parameters such as age, sex, educational level, among others, to try to calculate how much their salary could rise. This problem is important to solve because then a person could predict her future income through the decisions she would make in the present, such as how much education she should receive and when to start working to gain experience. Our procedure to solve this problem has been two statistical analyses, the first linear regression and a decision tree to be able to make a comparison between them, we have tested them using tools such as Colab (Python) and a dataset. Our population for our work was 32,000 records (rows). The results were that through the decision tree there was a precision of 0.88 and an accuracy of 0.82. And with respect to the logistic regression we obtained a precision of 0.80 when for the salary <=50K and 0.72 when the salary is >50K, the accuracy obtained is 0.7912. Concluding that between these two tools we are left with the Decision Tree. |
Resumen en español | En este proyecto se hace una diferenciación entre personas a travez de diferentes parametros como edad,sexo,nivel educativo entre otros,para tratar de calcular a cuanto podria asender su salario. Este problema es importante a resolver por que así una persona podría predecir su futuros ingresos a través de las decisiones que tomaría en el presente, como por ejemplo hasta qué grado de educación debe recibir y cuando ya comenzar a trabajar para obtener experiencia. Nuestro procedimiento para resolver este problema han sido dos análisis estadísticos ,el primero regresión lineal y un árbol de decisión para poder hacer una comparativa entre estos, las hemos probado usando herramientas como Colab (Python) y un dataset. Nuestra población de nuestro trabajo fue de 32000 registros (filas).Los resultados fueron que a través del árbol de decisión hubo una precisión de 0.879 y un accuracy de 0.817 .Y con respecto a la regresión logística obtuvimos una precisión de 0.80 cuando para el sueldo <=50K y 0.72 cuando el sueldo es >50K, el accuracy obtenido es de 0.7912. Dando por conclusión que entre estas dos herramientas nos quedamos con el Árbol de decisión. |
Palabras clave: | Inteligencia Artificial, árboles de decisión, regresión logística, dataset, nivel socioeconómico |
Keyword: | Artificial Intelligence, decision trees, logistic regression, dataset, socioeconomic status |
Texto completo: | Texto completo (Ver PDF) Texto completo (Ver HTML) |