Estudio empírico del enfoque asociativo en el contexto de los problemas de clasificación



Document title: Estudio empírico del enfoque asociativo en el contexto de los problemas de clasificación
Journal: Computación y sistemas
Database:
System number: 000560319
ISSN: 1405-5546
Authors: 1
2
3
4
5
6
1
1
Institutions: 1Instituto Politécnico Nacional, Escuela Superior de Ingeniería Mecánica y Eléctrica, Ciudad de México. México
2Tecnológico Nacional de México, Instituto Tecnológico de Matamoros, Matamoros, Tamaulipas. México
3Universidad Autónoma del Estado de México, Facultad de Ingeniería, Toluca. México
4Universitat Jaume I, Instituto de Nuevas Tecnologías de la Imagen, Castellón de la Plana, Valencia. España
5Universidad Autónoma de Ciudad Juárez, Departamento de Ingeniería Eléctrica y Computación, Ciudad Juárez, Chihuahua. México
6Instituto Politécnico Nacional, Centro de Investigación en Computación, Ciudad de México. México
Year:
Season: Abr-Jun
Volumen: 23
Number: 2
Pages: 601-617
Country: México
Language: Español
Document type: Artículo
Spanish abstract Investigaciones realizadas por la comunidad científica han evidenciado que el rendimiento de los clasificadores, no solamente depende de la regla de aprendizaje, sino también de las complejidades inherentes en los conjuntos de datos. Algunos clasificadores se han utilizado habitualmente en el contexto de los problemas de clasificación (tres Redes neuronales, C4.5, SVM, entre otros). No obstante, el enfoque asociativo se ha explorado más en en el ámbito de recuperación, que en la tarea de clasificación, y su rendimiento se ha analizado escasamente cuando se presentan varias complejidades en los datos. La presente investigación analiza el rendimiento del enfoque asociativo (CHA, CHAT y Alfa Beta original) cuando se presentan tres problemas de clasificación (desequilibrio de las clases, solapamiento y patrones atípicos). Los resultados evidencian que el CHAT reconoce mejor la clase minoritaria en comparación con el resto de los clasificadores en el contexto del desequilibrio de las clases. Sin embargo, el modelo CHA ignora la clase minoritaria en la mayoría de los casos. Además, el modelo CHAT exhibe la necesidad de requerir de fronteras de decisión bien definidas cuando se aplica el método de Wilson, ya que su rendimiento se incrementa. También, se notó que cuando se enfatiza un equilibrio entre las tasas, el rendimiento de tres clasificadores incrementa (CHAT, RB y RFBR). El modelo Alfa beta original sigue mostrando un desempeño pobre cuando se realiza el pre-procesamiento en los datos. El rendimiento de los clasificadores incrementa significativamente al aplicarse el método SMOTE, situación que no se presenta sin un pre-procesamiento o submuestreo, en el contexto del desequilibrio de las clases.
English abstract Research carried out by the scientific community has shown that the performance of the classifiers depends not only on the learning rule, if not also on the complexities inherent in the data sets. Some traditional classifiers have been commonly used in the context of classification problems (three Neural Networks, C4.5, SVM, among others). However, the associative approach has been further explored in the recovery context, than in the classification task, and its performance almost has not been analyzed when several complexities in the data are presented. The present investigation analyzes the performance of the associative approach (CHA, CHAT and original Alpha Beta) when three classification problems occur (class imbalance, overlapping and atypical patterns). The results show that the CHAT algorithm recognizes the minority class better than the rest of the classifiers in the context of class imbalance. However, the CHA model ignores the minority class in most cases. In addition, the CHAT algorithm requires well-defined decisión boundaries when Wilson's method is applied, because of its performance increases. Also, it was noted that when a balance between the rates is emphasized, the performance of the three classifiers increase (RB, RFBR and CHAT). The original Alfa Beta model shows poor performance when pre-processing the data is done. The performance of the classifiers increases significantly when the SMOTE method is applied, which does not occur without a pre-processing or with a subsampling, in the context of the imbalance of the classes.
Disciplines: Ciencias de la computación
Keyword: Recuperación,
Clasificación,
Enfoque asociativo,
Redes neuronales,
C4.5,
SVM,
Desequilibrio,
Solapamiento,
Patrones atípicos,
Wilson,
Selectivo,
SMOTE,
Inteligencia artificial
Keyword: Recovery,
Classification,
Associative approach,
Neural networks,
C4.5,
SVM,
Imbalance,
Overlap,
Atypical patterns,
Wilson,
Selective,
SMOTE,
Artificial intelligence
Full text: Texto completo (Ver HTML) Texto completo (Ver PDF)