Revista: | Revista Perspectiva Empresarial (Sabaneta) |
Base de datos: | CLASE |
Número de sistema: | 000509275 |
ISSN: | 2389-8194 |
Autores: | Rodríguez Mazahua, Nidia Rodríguez Mazahua, Lisbeth López Chau, Asdrúbal Alor Hernández, Giner |
Año: | 2020 |
Volumen: | 7 |
Número: | 2 |
Paginación: | 31-43 |
País: | Colombia |
Idioma: | Español |
Tipo de documento: | Artículo |
Enfoque: | Analítico, descriptivo |
Resumen en español | Uno de los principales problemas a los que se enfrentan los diseñadores de almacenes de datos es la fragmentación. Varios estudios han propuesto métodos de fragmentación horizontal basados en la minería de datos. No obstante, no existe una técnica de fragmentación horizontal que utilice un árbol de decisión. Este trabajo presenta el análisis de diferentes algoritmos de árboles de decisión con el fin de seleccionar el mejor para implementar el método de fragmentación. Dicho análisis se realizó bajo la versión 3.9.4 de Weka, considerando cuatro métricas de evaluación (Precision, ROC Area, Recall y F-measure) para diferentes conjuntos de datos seleccionados utilizando el Star Schema Benchmark. Los resultados mostraron que los dos mejores algoritmos fueron J48 y Random Forest en la mayoría de los casos; sin embargo se seleccionó J48 por ser más eficiente en la construcción del modelo |
Resumen en inglés | One of the main problems faced by Data Warehouse designers is fragmentation. Several studies have proposed data mining-based horizontal fragmentation methods. However, not exists a horizontal fragmentation technique that uses a decision tree. This paper presents the analysis of different decision tree algorithms to select the best one to implement the fragmentation method. Such analysis was performed under version 3.9.4 of Weka, considering four evaluation metrics (Precision, ROC Area, Recall and F-measure) for different selected data sets using the Star Schema Benchmark. The results showed that the two best algorithms were J48 and Random Forest in most cases; nevertheless, J48 was selected because it is more efficient in building the model |
Resumen en portugués | Um dos principais problemas aos que se enfrentam os desenhadores de armazéns de dados é a fragmentação. Vários estudos hão proposto métodos de fragmentação horizontal baseados na mineração de dados. Não obstante, não existe uma técnica de fragmentação horizontal que utilize uma árvore de decisão. Este trabalho apresenta a análise de diferentes algoritmos de árvores de decisão com o fim de selecionar o melhor para implementar o método de fragmentação. Dita análise se realizou sob a versão 3.9.4 de Weka, considerando quatro métricas de avaliação (Precision, ROC Area, Recall e F-measure) para diferentes conjuntos de dados selecionados utilizando o Star Schema Benchmark. Os resultados mostraram que os dois melhores algoritmos foram J48 e Random Forest na maioria dos casos; entretanto se selecionou J48 por ser mais eficiente na construção do modelo |
Disciplinas: | Administración y contaduría |
Palabras clave: | Administración de instituciones, Análisis de datos, Sistemas informáticos, Bases de datos, Inteligencia artificial (IA), Toma de decisiones |
Texto completo: | https://revistas.ceipa.edu.co/index.php/perspectiva-empresarial/article/view/667/935 |