Clasificación y determinación del número óptimo de conglomerados en bancos de germoplasma



Título del documento: Clasificación y determinación del número óptimo de conglomerados en bancos de germoplasma
Revista: Centro agrícola
Base de datos: PERIÓDICA
Número de sistema: 000405210
ISSN: 0253-5785
Autores: 1
1
1
1
1
2
Instituciones: 1Instituto de Investigaciones de Viandas Tropicales, Santo Domingo, Villa Clara. Cuba
2Universidad Central "Marta Abreu" de Las Villas, Santa Clara, Villa Clara. Cuba
Año:
Periodo: Oct-Dic
Volumen: 40
Número: 4
Paginación: 19-24
País: Cuba
Idioma: Español
Tipo de documento: Artículo
Enfoque: Analítico, descriptivo
Resumen en español El presente trabajo está encaminado a determinar el método de combinación de agrupamiento que mejor responda a la clasificación no supervisada de los bancos de germoplasma en estudio y el índice de validación que mejor determine el número óptimo de conglomerados jerárquicos aglomerativos. En la investigación se utilizó la métrica de Gower para variables mixtas y se combinó las soluciones provenientes de los diferentes métodos de agrupamiento para obtener una topología consenso. La fortaleza de los agrupamientos obtenidos del conjunto de datos por los métodos de aglomeración fue evaluada con el coeficiente aglomerativo y los conglomerados consenso, con el índice RV. El número de conglomerado óptimo se determinó utilizando cinco índices de validación que no brindaron un resultado homogéneo. La mejor estructura consenso para las bases de datos en estudio se obtuvo con el método Manhattan . Se utilizaron funciones implementadas en el lenguaje de programación R. Esta estrategia de análisis fue aplicada por primera vez para la clasificación taxonómica de las colecciones cubanas de germoplasma de malanga ( Xanthosoma spp.) y plátanos ( Musa spp.)
Resumen en inglés The present work aims at determining the clustering combination method that better fits the non-supervised classification of germplasm banks, as well as the validation index which more efficiently determines the optimal number of agglomerative hierarchical clusters. Mixed variables Gower metric was used in the research and the solutions coming out of the diverse clustering methods were combined so as to obtain a consensus structure. The strength of the clusters obtained by the clustering methods out of the data was evaluated using the agglomerative coefficient and the consensus conglomerate with the RV index. The optimal conglomerate number is obtained using five validation indexes which didn’t bring about a homogeneous result. The better consensus structure for data base was obtained using the Manhattan method. Functions implemented in R programming language were used. This analysis strategy was used for the first time for the taxonomic classification of Cuban collections of new cocoyam ( Xanthosoma spp.) and banana ( Musa spp.) germplasm
Disciplinas: Biología,
Ciencias de la computación
Palabras clave: Botánica,
Programación,
Bancos de germoplasma,
Análisis de cúmulos,
Algoritmos
Keyword: Biology,
Computer science,
Botany,
Programming,
Germplasm banks,
Cluster analysis,
Algorithms
Texto completo: Texto completo (Ver PDF)