Um Algoritmo para o Agrupamento Baseado em K-Medoids



Título del documento: Um Algoritmo para o Agrupamento Baseado em K-Medoids
Revista: Revista brasileira de estatistica
Base de datos: CLASE
Número de sistema: 000350216
ISSN: 0034-7175
Autores: 1


Instituciones: 1Escola Nacional de Ciencias Estatisticas, Rio de Janeiro. Brasil
Año:
Periodo: Ene-Dic
Volumen: 71
Número: 234
Paginación: 75-100
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Enfoque: Analítico, teórico
Resumen en inglés We describe a new algorithm to solve a classical clustering problem known as k-medoids problem. This problem is analogous to the k-means problem, which is commonly related to stratification in sample surveys. However, the centroids are now replaced by medoids, aiming to obtain more robust and homogeneous clusters. Given n objects with p attributes and a fixed number k of desired clusters, we must select k objects (medoids), in such a way to minimize the sum of distances from each one of the remaining (n-k) objects to its respective nearest medoid. Constraining the maximum number of objects per cluster, we obtain the capacitated k-medoids problem. The algorithm proposed in this paper is based on the ILS (Iterated Local Search) method. Computational results using IBGE demographic census reveal a reasonable performance of the algorithm in terms of computational time consumption and quality of the solutions
Resumen en portugués Descreve-se um novo algoritmo para um problema clássico de agrupamento, conhecido como problema dos k-medoids. Esse problema é análogo ao problema das k-médias, cuja resolução encontra aplicação frequente na fase de estratificação em amostragem probabilística. Entretanto, substituem-se os centroides por medoids, objetivando-se obter agrupamentos mais homogêneos e robustos. Dados n objetos com p atributos e fixado um número k de agrupamentos, deve-se selecionar k objetos (medoids) de forma a minimizar a soma das distâncias de cada um dos (n-k) objetos restantes ao seu medoid mais próximo. Ao se limitar o número máximo de objetos por grupo, obtemos o chamado problema dos k-medoids capacitado. O algoritmo proposto neste trabalho é baseado no método ILS (Iterated Local Search). A partir de dados do censo demográfico do IBGE, resultados computacionais mostram um desempenho razoável do algoritmo em termos de tempo computacional e de qualidade das soluções obtidas
Disciplinas: Matemáticas,
Ciencias de la computación
Palabras clave: Matemáticas puras,
Teoría de la computación,
Algoritmos,
Clusters,
K-medoides
Texto completo: Texto completo (Ver PDF)