Revista: | Computación y sistemas |
Base de datos: | PERIÓDICA |
Número de sistema: | 000359065 |
ISSN: | 1405-5546 |
Autores: | Franco Arcega, Anilu1 Carrasco Ochoa, Jesús Ariel2 Sánchez Díaz, Guillermo3 Martínez-Trinidad, José Francisco2 |
Instituciones: | 1Universidad Autónoma del Estado de Hidalgo, Pachuca, Hidalgo. México 2Instituto Nacional de Astrofísica, Optica y Electrónica, Tonantzintla, Puebla. México 3Universidad Autónoma de San Luis Potosí, San Luis Potosí. México |
Año: | 2013 |
Periodo: | Ene-Mar |
Volumen: | 17 |
Número: | 1 |
Paginación: | 95-102 |
País: | México |
Idioma: | Inglés |
Tipo de documento: | Artículo |
Enfoque: | Experimental, aplicado |
Resumen en español | En este artículo se desarrollaron varios algoritmos de generación de árboles de decisión a partir de grandes conjuntos de datos, los cuales resuelven algunas de las limitaciones de los algoritmos más recientes del estado del arte. Tres de estos algoritmos permiten procesar conjuntos de datos descritos exclusivamente por atributos numéricos; y otro puede procesar conjuntos de datos mezclados. Los algoritmos propuestos procesan todos los objetos del conjunto de entrenamiento sin necesidad de almacenarlo completo en memoria. Además, los algoritmos desarrollados son más rápidos que los algoritmos más recientes para la generación de árboles de decisión para grandes conjuntos de datos, obteniendo resultados de clasificación competitivos |
Resumen en inglés | In this paper, several algorithms have been developed for building decision trees from large datasets. These algorithms overcome some restrictions of the most recent algorithms in the state of the art. Three of these algorithms have been designed to process datasets described exclusively by numeric attributes, and the fourth one, for processing mixed datasets. The proposed algorithms process all the training instances without storing the whole dataset in the main memory. Besides, the developed algorithms are faster than the most recent algorithms for building decision trees from large datasets, and reach competitive accuracy rates |
Disciplinas: | Ciencias de la computación, Matemáticas |
Palabras clave: | Procesamiento de datos, Matemáticas aplicadas, Arboles de decisión, Algoritmos, Clasificación supervisada |
Keyword: | Computer science, Mathematics, Data processing, Applied mathematics, Decision trees, Algorithms, Supervised classification |
Texto completo: | Texto completo (Ver HTML) |