Aprendiendo con detección de cambio online



Título del documento: Aprendiendo con detección de cambio online
Revue: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000373011
ISSN: 1405-5546
Autores: 1
2
2
2
3
4
Instituciones: 1Universidad de las Ciencias Informáticas, La Habana. Cuba
2Universidad de Málaga, Málaga. España
3Universidad de Granma, Granma. Cuba
4Universidad de Camagüey, Camagüey. Cuba
Año:
Periodo: Ene-Mar
Volumen: 18
Número: 1
Paginación: 169-183
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español En la actualidad, muchas fuentes generan grandes cantidades de datos en largos períodos de tiempo, requiriéndose su procesamiento incremental. Debido a la dimensión temporal de estos datos, un modelo de aprendizaje inducido previamente puede ser inconsistente con los datos actuales, problema comúnmente conocido como cambio de concepto. Una estrategia ampliamente usada para detectar cambio de concepto supervisa a lo largo del tiempo alguna medida de rendimiento del modelo. Si se estima un deterioro significativo del modelo mediante dicha medida se ejecutan algunas acciones para adaptar el aprendizaje. En este sentido, en el presente artículo se propone un nuevo método para detectar cambio de concepto no dependiente del algoritmo de aprendizaje. Se usa la inecuación de probabilidad de Hoeffding para ofrecer garantías probabilísticas de detección de cambios en la media de flujos de valores reales. Dicho método se basa en la comparación de medias correspondientes a dos muestras, mediante la identificación de un único punto de corte relevante en dicha secuencia de valores reales; manteniendo así un número fijo de contadores además con complejidad temporal constante. Evaluaciones empíricas preliminares considerando conocidos flujos de datos, diferentes detectores de cambio de concepto y algoritmos de aprendizaje muestran promisorio el método propuesto
Resumen en inglés Learning in data streams is a problem of growing interest. The target function of data streams may change over time, so in such situations, a learning model induced with some previous data may be inconsistent with the current data. This problem is commonly known as concept drift. The strategy broadly used to handle concept drift is to continuously monitor a chosen performance measure of the model over time; if the model performance drops, adequate actions are executed to adapt the model. Taking this into account, our paper proposes a new method to detect drifting concepts, which is independent of the learning algorithm. We use a probability inequality (Hoeffding's inequality) to offer probabilistic guarantees for the detection of significant changes in the mean of real values. The detection is based on the comparison of averages corresponding to two samples by means of identification of a single relevant cut-point in this sequence of real values maintaining a fixed number of counters and with constant time complexity. As some previous approaches, our method is based on ideas of statistical process control. Preliminary empirical evaluations considering well-known data streams, change detectors and various classifiers reveal advantages of the proposed method
Disciplinas: Ciencias de la computación
Palabras clave: Inteligencia artificial,
Aprendizaje de máquinas,
Cambio de concepto,
Cota de Hoeffding,
Flujo de datos
Keyword: Computer science,
Artificial intelligence,
Machine learning,
Concept drift,
Hoeffding bound,
Data flow
Texte intégral: Texto completo (Ver HTML)