Tratamiento del desbalance en problemas con múltiples clases con ECOC



Título del documento: Tratamiento del desbalance en problemas con múltiples clases con ECOC
Revue: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000368983
ISSN: 1405-5546
Autores: 1

2
1
3
Instituciones: 1Universidad Autónoma del Estado de México, Facultad de Ingeniería, Toluca, Estado de México. México
2Tecnológico de Estudios Superiores de Jocotitlán, Jocotitlán, Estado de México. México
3Universidad Autónoma del Estado de México, Centro Universitario, Texcoco, Estado de México. México
Año:
Periodo: Oct-Dic
Volumen: 17
Número: 4
Paginación: 583-592
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español El problema del desbalance de clases puede producir un deterioro importante en la efectividad del clasificador, en particular con los patrones de las clases menos representadas. El desbalance en el conjunto de entrenamiento (CE) significa que una clase es representada por una gran cantidad de patrones mientras que otra es representada por muy pocos. Los estudios existentes se encuentran orientados principalmente a tratar problemas de dos clases, no obstante, un importante número de problemas reales se encuentran representados por múltiples clases, donde resulta más difícil su discriminación para el clasificador. El éxito de la Mezcla de Expertos (ME) se basa en el criterio de "divide y vencerás". En su funcionamiento general, el problema es dividido en fragmentos más pequeños que serán estudiados por separado. De este modo, el modelo general es poco influenciado por las dificultades individuales de sus componentes. La idea principal del estudio aquí mostrado, es construir una Mezcla de expertos cuyos miembros serán entrenados en una parte del problema general y de este modo, mejorar el rendimiento del clasificador en el contexto de múltiples clases. Para este fin, se hace uso de los métodos conocidos como Error-correcting output codes (ECOC), que permiten realizar una codificación en parejas de clases el problema de estudio. Resultados experimentales sobre conjuntos de datos reales, muestran la viabilidad de la estrategia aquí propuesta
Resumen en inglés Imbalanced training sample means that one class is represented by a large number of examples while the other is represented by only a few. This problem may produce an important deterioration of the classifier performance, in particular with patterns belonging to the less represented classes. The majority of the studies in this area are oriented, mainly, to resolve problems with two classes. However, many real problems are represented by multiple classes, where it is more difficult to discriminate between them. The success of the Mixture of Experts (ME) strategy is based on the criterion of "divide and win". The general process divides the global problem into smaller fragments which will be studied separately. In this way, the general model has few influences of the individual difficulties (of their members). In this paper we propose a strategy for handling the class imbalance problem for data sets with multiple classes. For that, we integrate a mixture of experts whose members will be trained as a part of the general problem and, in this way, will improve the behavior of the whole system. For dividing the problem we employ the called Error-correcting output codes (ECOC) methods, when the classes are codified in pairs, which are considered for training the mixture of experts. Experiments with real datasets demonstrate the viability of the proposed strategy
Disciplinas: Ciencias de la computación
Palabras clave: Procesamiento de datos,
Clases múltiples,
Fusión
Keyword: Computer science,
Data processing,
Multiple classes,
Fusion,
Training
Texte intégral: Texto completo (Ver HTML)