Noise Detection and Learning Based on Current Information



Título del documento: Noise Detection and Learning Based on Current Information
Revista: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000373005
ISSN: 1405-5546
Autores: 1
1
2
Instituciones: 1Universidad de Oriente, Facultad de Ciencias Económicas y Empresariales, Santiago de Cuba. Cuba
2Universidad de Oriente, Facultad de Matemática y Computación, Santiago de Cuba. Cuba
Año:
Periodo: Ene-Mar
Volumen: 18
Número: 1
Paginación: 153-167
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español Los métodos de limpieza de ruido tienen una gran significación en tareas de clasificación y en situaciones en las que es necesario realizar un aprendizaje semi-supervisado, debido a la importancia que tiene contar con muestras bien etiquetadas (prototipos) para clasificar nuevos patrones. En este trabajo, presentamos un nuevo algoritmo de detección de ruido en flujos de datos, que tiene en cuenta los cambios de los conceptos en el tiempo (concept drift), el cual está basado en criterios de vecindad, y su aplicación en la construcción automática de conjuntos de entrenamiento. En los experimentos realizados se utilizaron bases de datos sintéticas y reales, las últimas fueron tomadas del repositorio UCI, los resultados obtenidos avalan nuestra estrategia de detección de ruido en flujos de datos y en procesos de clasificación
Resumen en inglés Methods for noise cleaning have great significance in classification tasks and in situations when it is necessary to carry out a semi-supervised learning due to importance of having well-labeled samples (prototypes) for classification of the new patterns. In this work, we present a new algorithm for detecting noise in data streams that takes into account changes in concepts over time (concept drift). The algorithm is based on the neighborhood criteria and its application uses the construction of a training set. In our experiments we used both synthetic and real databases, the latter were taken from UCI repository. The results support our proposal of noise detection in data streams and classification processes
Disciplinas: Ciencias de la computación
Palabras clave: Inteligencia artificial,
Aprendizaje de máquinas,
Aprendizaje supervisado,
Flujo de datos,
Limpieza de ruido
Keyword: Computer science,
Artificial intelligence,
Machine learning,
Supervised learning,
Data flow,
Noise cleaning
Texto completo: Texto completo (Ver HTML)