Revista: | Revista brasileira de estatistica |
Base de datos: | CLASE |
Número de sistema: | 000441737 |
ISSN: | 0034-7175 |
Autores: | Oliveira, Marcos Garrido de1 Zotes, Luiz Perez1 Quelhas, Osvaldo Luiz Goncalves1 Pereira, Valdecy1 Carvalho, Carlos Antonio da Silva1 |
Instituciones: | 1Universidade Federal Fluminense, Escola de Engenharia, Niteroi, Rio de Janeiro. Brasil |
Año: | 2015 |
Periodo: | Ene-Dic |
Volumen: | 76 |
Número: | 241 |
Paginación: | 51-78 |
País: | Brasil |
Idioma: | Portugués |
Tipo de documento: | Artículo |
Enfoque: | Analítico, teórico |
Resumen en inglés | This article proposes a comparison of performance between automatic clusters methods, Kmeans and Partitioning Around Medoids (PAM), applied in simulated data with and without outliers. For this analysis, it’s suggested the decision diagram procedure to define the number of groups, assessing the significance of the variables and the definition of the elements that will compose each group. Whereas both cluster analysis techniques are powerful tools in segmenting the observations, the choice of these tools usually are related to the origin of databases, research costs and knowledge of the researcher on the subject. In the results presented in this paper, the techniques K-means and Partitioning Around Medoids had similar performances with the sample data without outliers. However, when analyzed with the outliers, the Medoids Partitioning Around technique proves to be more robust and consistent compared with the K-means technique |
Resumen en portugués | Este artigo propõe a comparação entre os métodos de agrupamentos automáticos K-means e Partitioning Around Medoids (PAM) aplicados em dados simulados, sem outliers e com outliers (valores atípicos). Para essa finalidade, foi sugerido o procedimento diagrama de decisão para definição do número de grupos, avaliação da significância das variáveis em estudo e a definição dos elementos que irão compor cada grupo. Considerando que ambos os métodos de Análise de Agrupamentos são ferramentas poderosas na segmentação das observações, a escolha dessas ferramentas, geralmente, está relacionada com a origem das bases de dados, custos de pesquisas e ao conhecimento do pesquisador sobre o tema. Pelos resultados expostos neste trabalho, percebemos que as técnicas K-means e Partitioning Around Medoids (PAM) apresentaram performances semelhantes com os dados da amostra sem outliers. Porém, quando analisadas com os valores atípicos, a técnica Partitioning Around Medoids (PAM) evidencia maior robustez e consistência se comparada com a técnica K-means. ide |
Disciplinas: | Matemáticas |
Palabras clave: | Matemáticas aplicadas, Estadística, Análisis de Cluster, Partición, K-medoides |
Texto completo: | Texto completo (Ver PDF) |