A multiple-filter-GA-SVM method for dimension reduction and classification of DNA-microarray data



Título del documento: A multiple-filter-GA-SVM method for dimension reduction and classification of DNA-microarray data
Revista: Revista mexicana de ingeniería biomédica
Base de datos: PERIÓDICA
Número de sistema: 000351121
ISSN: 0188-9532
Autores: 1
1
1
Instituciones: 1Instituto Tecnológico de Apizaco, Laboratorio de Investigación en Tecnologíaas Inteligentes, Apizaco, Tlaxcala. México
Año:
Periodo: Jul
Volumen: 32
Número: 1
Paginación: 32-39
País: México
Idioma: Inglés
Tipo de documento: Artículo
Enfoque: Experimental, analítico
Resumen en español El presente trabajo propone un múltiple-filtro utilizando un algoritmo genético (AG) combinado con una máquina de soporte vectorial (MSV) para la selección de genes y la clasificación de datos obtenidos de micro-arreglos de ADN. El método propuesto es diseñado para seleccionar un sub-conjunto de genes pertinentes que clasifiquen los datos obtenidos de micro-arreglos de ADN más eficientemente. Primero, tres métodos estadísticos tradicionales son usados para la selección de genes. Luego, diferentes sub-conjuntos de genes pertinentes son seleccionados por medio de una estructura AG-MSV utilizando la técnica deja uno fuera de validación cruzada (DUFVC) para evitar el sobre-entrenamiento de los datos. Un sub-conjunto de genes (nicho), que consiste de genes pertinentes, es obtenido de cada método estadístico, al cual analiza la frecuencia de cada gen en diferentes sub-conjuntos de genes. Finalmente, los genes más frecuentes contenidos en el nicho son nuevamente evaluados por la estructura AG-MSV para obtener a sub-conjunto final de genes pertinentes. El método propuesto es evaluado en dos bases de micro-arreglos: Leucemia y colon. En los resultados experimentales se observa que el múltiplefiltro-AG-MSV trabajo muy bien logrando bajas tasas de error en la clasificación usando un número pequeño de genes más que otros métodos reportados en la literatura
Resumen en inglés The following article proposes a Multiple-Filter by using a genetic algorithm (GA) combined with a support vector machine (SVM) for gene selection and classification of DNA microarray data. The proposed method is designed to select a subset of relevant genes that classify the DNA-microarray data more accurately. First, three traditional statistical methods are used for gene selection. Then different relevant gene subsets are selected by using a GA/SVM framework using leave-one-out cross validation (LOOCV) to avoid data overfitting. A gene subset (niche), consisting of relevant genes, is obtained from each statistical method, by analyzing the frequency of each gene in the different gene subsets. Finally, the most frequent genes contained in the niche, are evaluated by the GA/ SVM to obtain a final relevant gene subset. The proposed method is tested in two DNA-microarray datasets: Leukemia and colon. In the experimental results it is observed that the Multiple-Filter-GA-SVM (MF-GA-SVM) work very well by achieving lower classification error rates using a smaller number of selected genes than other methods reported in the literature
Disciplinas: Medicina
Palabras clave: Ingeniería biónica y cibernética,
Genética,
Microarreglos,
ADN,
Filtros,
Algoritmos genéticos,
Selección de genes
Keyword: Medicine,
Bionics and cybernetics,
Genetics,
Microarrays,
DNA,
Filters,
Genetic algorithms,
Gene selection
Texto completo: Texto completo (Ver PDF)