Comparação dos métodos de Análise Agrupamentos K-means e Partitioning Around Medoids (PAM)



Título del documento: Comparação dos métodos de Análise Agrupamentos K-means e Partitioning Around Medoids (PAM)
Revista: Revista brasileira de estatistica
Base de datos: CLASE
Número de sistema: 000441737
ISSN: 0034-7175
Autores: 1
1
1
1
1
Instituciones: 1Universidade Federal Fluminense, Escola de Engenharia, Niteroi, Rio de Janeiro. Brasil
Año:
Periodo: Ene-Dic
Volumen: 76
Número: 241
Paginación: 51-78
País: Brasil
Idioma: Portugués
Tipo de documento: Artículo
Enfoque: Analítico, teórico
Resumen en inglés This article proposes a comparison of performance between automatic clusters methods, Kmeans and Partitioning Around Medoids (PAM), applied in simulated data with and without outliers. For this analysis, it’s suggested the decision diagram procedure to define the number of groups, assessing the significance of the variables and the definition of the elements that will compose each group. Whereas both cluster analysis techniques are powerful tools in segmenting the observations, the choice of these tools usually are related to the origin of databases, research costs and knowledge of the researcher on the subject. In the results presented in this paper, the techniques K-means and Partitioning Around Medoids had similar performances with the sample data without outliers. However, when analyzed with the outliers, the Medoids Partitioning Around technique proves to be more robust and consistent compared with the K-means technique
Resumen en portugués Este artigo propõe a comparação entre os métodos de agrupamentos automáticos K-means e Partitioning Around Medoids (PAM) aplicados em dados simulados, sem outliers e com outliers (valores atípicos). Para essa finalidade, foi sugerido o procedimento diagrama de decisão para definição do número de grupos, avaliação da significância das variáveis em estudo e a definição dos elementos que irão compor cada grupo. Considerando que ambos os métodos de Análise de Agrupamentos são ferramentas poderosas na segmentação das observações, a escolha dessas ferramentas, geralmente, está relacionada com a origem das bases de dados, custos de pesquisas e ao conhecimento do pesquisador sobre o tema. Pelos resultados expostos neste trabalho, percebemos que as técnicas K-means e Partitioning Around Medoids (PAM) apresentaram performances semelhantes com os dados da amostra sem outliers. Porém, quando analisadas com os valores atípicos, a técnica Partitioning Around Medoids (PAM) evidencia maior robustez e consistência se comparada com a técnica K-means. ide
Disciplinas: Matemáticas
Palabras clave: Matemáticas aplicadas,
Estadística,
Análisis de Cluster,
Partición,
K-medoides
Texto completo: Texto completo (Ver PDF)