Efficiently Finding the Optimum Number of Clusters in a Dataset with a New Hybrid Cellular Evolutionary Algorithm



Título del documento: Efficiently Finding the Optimum Number of Clusters in a Dataset with a New Hybrid Cellular Evolutionary Algorithm
Revista: Computación y sistemas
Base de datos: PERIÓDICA
Número de sistema: 000376149
ISSN: 1405-5546
Autores: 1
1
1
1
Instituciones: 1Instituto Politécnico Nacional, Centro de Investigación en Computación, México, Distrito Federal. México
Año:
Periodo: Abr-Jun
Volumen: 18
Número: 2
Paginación: 313-327
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español Un reto actual en el área de algoritmos evolutivos híbridos es el empleo eficiente de estrategias para cubrir la totalidad del espacio de búsqueda usando búsqueda local solo en las regiones prometedoras. Por otra parte, los algoritmos de agrupamiento, fundamentales para procesos de minería de datos y técnicas de aprendizaje, carecen de métodos eficientes para determinar el número óptimo de grupos a formar a partir de un conjunto de datos. Algunos de los métodos existentes hacen uso de algunos algoritmos evolutivos, así como una función para validación de agrupamientos como su función objetivo. En este artículo se propone un nuevo algoritmo evolutivo celular, para abordar dicha tarea. El algoritmo propuesto está basado en un modelo híbrido de búsqueda, tanto global como local y tras presentarlo se prueba con una estensa experimentación sobre diferentes conjuntos de datos y diferentes funciones objetivo
Resumen en inglés A challenge in hybrid evolutionary algorithms is to employ efficient strategies to cover all the search space, applying local search only in actually promising search areas; on the other hand, clustering algorithms, a fundamental base for data mining procedures and learning techniques, suffer from the lack of efficient methods for determining the optimal number of clusters to be found in an arbitrary dataset. Some existing methods use evolutionary algorithms with cluster validation index as the objective function. In this article, a new cellular evolutionary algorithm based on a hybrid model of global and local heuristic search is proposed for the same task, and extensive experimentation is done with different datasets and indexes
Disciplinas: Ciencias de la computación
Palabras clave: Procesamiento de datos,
Algoritmos genéticos,
Agrupamiento,
Algoritmos evolutivos,
Optimización por enjambre de partículas,
Número optimo de clases
Keyword: Computer science,
Data processing,
Genetic algorithms,
Clustering,
Evolutionary algorithms,
Particle swarm optimization,
Optimal cluster number
Texto completo: Texto completo (Ver HTML)