Revista: | Avances en sistemas e informática |
Base de datos: | PERIÓDICA |
Número de sistema: | 000351987 |
ISSN: | 1657-7663 |
Autores: | Chávez, María del Carmen1 Casas, Gladys1 Moreira, Jorge1 Silveira, Pavel1 Moya, Iosvany1 Bello, Rafael1 Grau, Ricardo1 |
Instituciones: | 1Universidad Central "Marta Abreu" de Las Villas, Centro de Estudios de Informática, Santa Clara, Villa Clara. Cuba |
Año: | 2008 |
Periodo: | Jun |
Volumen: | 5 |
Número: | 2 |
Paginación: | 77-85 |
País: | Colombia |
Idioma: | Español |
Tipo de documento: | Artículo |
Enfoque: | Aplicado, descriptivo |
Resumen en español | En el análisis de gr andes volúmenes de datos es cr ucial la relación entre las var iables. Una de las for mas de modelar tales r elaciones es usar una r ed bayesiana. El costo computacional del apr endizaje de una r ed bayesiana desde datos, crece con el número de var iables en la misma y con el número de casos, por consiguiente sur ge el problema de identifi car algor itmos efi cientes que aprendan desde los datos. En el tr abajo se proponen tr es nuevos métodos de aprendizaje estr uctur al de redes bayesianas, dos de ellos se basan en las r elaciones de dependencia entr e las var iables usando la pr ueba Chi cuadr ado y el último hace uso de heur ística mediante el algor itmo evolutivo Optimización de Enjambr e de Par tículas (PSO, de sus siglas en inglés: Par ticle Swar m Optimization). Los algor itmos pr opuestos se han pr obado con var ios conjuntos de datos de la UCI Repositor y de Machine Lear ning y en el tr abajo se muestr an resultados en la pr edicción de mutaciones en secuencias de ADN de la proteína tr anscr iptasa inver sa del VIH (Human Immunodefi ciency Vir us) |
Resumen en inglés | In the analysis of large volumes of data it is impor tant to take into account the relationship among var iables. One of the ways to model these r elations is given by the use of Bayesian Networ ks (BN). The computational cost of lear ning from data in BN, gr ows with the increase of the number of var iables and cases; therefore, it is impor tant to create effi cient algor ithms which lear n fr om data. Thr ee differ ent methods for str uctur al lear ning in BN are proposed in this paper. Two of them are based on the chisquare statistical test and the last one is based on a bioinspir ed technique: Par ticle Swar m Optimization. All the algor ithms have been tested using sever al datasets available on the UCI Repositor y of Machine Lear ning. The pr esent wor k also shows results in the pr ediction of mutations in DNA sequences of the HIVrever setr anscr iptase pr otein |
Disciplinas: | Ciencias de la computación, Biología |
Palabras clave: | Procesamiento de datos, Genética, Secuencia génica, Transcriptasa inversa, Mutaciones, Modelos de predicción, Redes bayesianas, Aprendizaje estructural |
Keyword: | Computer science, Biology, Data processing, Genetics, Gene sequence, Reverse transcriptase, Mutations, Prediction models, Bayesian networks, Structural learning |
Texto completo: | Texto completo (Ver HTML) |