Revista: | Journal of science and research |
Base de datos: | CLASE |
Número de sistema: | 000463217 |
ISSN: | 2528-8083 |
Autores: | Mackenzie Rivero, Alexander1 Rodríguez Rodríguez, Alberto1 Merchán Carreño, Edwin Joao1 Martínez Béjar, Rodrigo2 |
Instituciones: | 1Universidad Estatal del Sur de Manabí, Jipijapa, Manabí. Ecuador 2Universidad de Murcia, Murcia. España |
Año: | 2017 |
Volumen: | 3 |
Paginación: | 44-49 |
País: | Ecuador |
Idioma: | Inglés |
Tipo de documento: | Artículo |
Enfoque: | Analítico |
Resumen en español | El uso del aprendizaje automático permite la creación de un modelo predictivo de datos, como resultado del análisis en un conjunto de datos con 286 instancias y nueve atributos pertenecientes al Instituto de Oncología del Centro Médico Universitario. Ljubljana. En función de esta situación, los datos se preprocesan aplicando técnicas inteligentes de análisis de datos para eliminar los valores perdidos, así como la evaluación de cada atributo que permite la optimización de resultados. Utilizamos varios algoritmos de clasificación incluyendo árboles J48, bosque aleatorio, bayes net, bayes naive, tabla de decisiones, para obtener uno que, dadas las características de los datos, permita el mejor porcentaje de clasificación y por lo tanto una mejor matriz de confusión, utilizando 66% de los datos para aprendizaje y 33% para validar el modelo. Con este modelo, se obtiene un predictor con una eficacia del 71,134 % para estimar o no la recurrencia del cáncer de mama |
Resumen en inglés | The use of machine learning allows the creation of a predictive data model, as a result of the analysis in a data set with 286 instances and nine attributes belonging to the Institute of Oncology of the University Medical Center. Ljubljana. Based on this situation, the data are preprocessed by applying intelligent data analysis techniques to eliminate missing values as well as the evaluation of each attribute that allows the optimization of results. We used several classification algorithms including J48 trees, random forest, bayes net, naive bayes, decision table, in order to obtain one that given the characteristics of the data, would allow the best classification percentage and therefore a better matrix of confusion, Using 66 % of the data for learning and 33 % for validating the model. Using this model, a predictor with a 71,134 % e effectiveness is obtained to estimate or not the recurrence of breast cancer |
Disciplinas: | Medicina, Bibliotecología y ciencia de la información, Ciencias de la computación |
Palabras clave: | Oncología, Tecnología de la información, Inteligencia artificial (IA), Aprendizaje de máquina, Cáncer, Mama, Prevención |
Texto completo: | Texto completo (Ver HTML) |