Comparative Analysis of Decision Tree Algorithms for Data Warehouse Fragmentation



Título del documento: Comparative Analysis of Decision Tree Algorithms for Data Warehouse Fragmentation
Revista: Revista Perspectiva Empresarial (Sabaneta)
Base de datos: CLASE
Número de sistema: 000509275
ISSN: 2389-8194
Autores:


Año:
Volumen: 7
Número: 2
Paginación: 31-43
País: Colombia
Idioma: Español
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en español Uno de los principales problemas a los que se enfrentan los diseñadores de almacenes de datos es la fragmentación. Varios estudios han propuesto métodos de fragmentación horizontal basados en la minería de datos. No obstante, no existe una técnica de fragmentación horizontal que utilice un árbol de decisión. Este trabajo presenta el análisis de diferentes algoritmos de árboles de decisión con el fin de seleccionar el mejor para implementar el método de fragmentación. Dicho análisis se realizó bajo la versión 3.9.4 de Weka, considerando cuatro métricas de evaluación (Precision, ROC Area, Recall y F-measure) para diferentes conjuntos de datos seleccionados utilizando el Star Schema Benchmark. Los resultados mostraron que los dos mejores algoritmos fueron J48 y Random Forest en la mayoría de los casos; sin embargo se seleccionó J48 por ser más eficiente en la construcción del modelo
Resumen en inglés One of the main problems faced by Data Warehouse designers is fragmentation. Several studies have proposed data mining-based horizontal fragmentation methods. However, not exists a horizontal fragmentation technique that uses a decision tree. This paper presents the analysis of different decision tree algorithms to select the best one to implement the fragmentation method. Such analysis was performed under version 3.9.4 of Weka, considering four evaluation metrics (Precision, ROC Area, Recall and F-measure) for different selected data sets using the Star Schema Benchmark. The results showed that the two best algorithms were J48 and Random Forest in most cases; nevertheless, J48 was selected because it is more efficient in building the model
Resumen en portugués Um dos principais problemas aos que se enfrentam os desenhadores de armazéns de dados é a fragmentação. Vários estudos hão proposto métodos de fragmentação horizontal baseados na mineração de dados. Não obstante, não existe uma técnica de fragmentação horizontal que utilize uma árvore de decisão. Este trabalho apresenta a análise de diferentes algoritmos de árvores de decisão com o fim de selecionar o melhor para implementar o método de fragmentação. Dita análise se realizou sob a versão 3.9.4 de Weka, considerando quatro métricas de avaliação (Precision, ROC Area, Recall e F-measure) para diferentes conjuntos de dados selecionados utilizando o Star Schema Benchmark. Os resultados mostraram que os dois melhores algoritmos foram J48 e Random Forest na maioria dos casos; entretanto se selecionou J48 por ser mais eficiente na construção do modelo
Disciplinas: Administración y contaduría
Palabras clave: Administración de instituciones,
Análisis de datos,
Sistemas informáticos,
Bases de datos,
Inteligencia artificial (IA),
Toma de decisiones
Texto completo: https://revistas.ceipa.edu.co/index.php/perspectiva-empresarial/article/view/667/935