Predicción de Mutaciones en Secuencias de la Proteína Transcriptasa Inversa del VIH usando Nuevos Métodos para Aprendizaje Estructural de Redes Bayesianas



Título del documento: Predicción de Mutaciones en Secuencias de la Proteína Transcriptasa Inversa del VIH usando Nuevos Métodos para Aprendizaje Estructural de Redes Bayesianas
Revista: Avances en sistemas e informática
Base de datos: PERIÓDICA
Número de sistema: 000351987
ISSN: 1657-7663
Autores: 1
1
1
1
1
1
1
Instituciones: 1Universidad Central "Marta Abreu" de Las Villas, Centro de Estudios de Informática, Santa Clara, Villa Clara. Cuba
Año:
Periodo: Jun
Volumen: 5
Número: 2
Paginación: 77-85
País: Colombia
Idioma: Español
Tipo de documento: Artículo
Enfoque: Aplicado, descriptivo
Resumen en español En el análisis de gr andes volúmenes de datos es cr ucial la relación entre las var iables. Una de las for mas de modelar tales r elaciones es usar una r ed bayesiana. El costo computacional del apr endizaje de una r ed bayesiana desde datos, crece con el número de var iables en la misma y con el número de casos, por consiguiente sur ge el problema de identifi car algor itmos efi cientes que aprendan desde los datos. En el tr abajo se proponen tr es nuevos métodos de aprendizaje estr uctur al de redes bayesianas, dos de ellos se basan en las r elaciones de dependencia entr e las var iables usando la pr ueba Chi cuadr ado y el último hace uso de heur ística mediante el algor itmo evolutivo Optimización de Enjambr e de Par tículas (PSO, de sus siglas en inglés: Par ticle Swar m Optimization). Los algor itmos pr opuestos se han pr obado con var ios conjuntos de datos de la UCI Repositor y de Machine Lear ning y en el tr abajo se muestr an resultados en la pr edicción de mutaciones en secuencias de ADN de la proteína tr anscr iptasa inver sa del VIH (Human Immunodefi ciency Vir us)
Resumen en inglés In the analysis of large volumes of data it is impor tant to take into account the relationship among var iables. One of the ways to model these r elations is given by the use of Bayesian Networ ks (BN). The computational cost of lear ning from data in BN, gr ows with the increase of the number of var iables and cases; therefore, it is impor tant to create effi cient algor ithms which lear n fr om data. Thr ee differ ent methods for str uctur al lear ning in BN are proposed in this paper. Two of them are based on the chisquare statistical test and the last one is based on a bioinspir ed technique: Par ticle Swar m Optimization. All the algor ithms have been tested using sever al datasets available on the UCI Repositor y of Machine Lear ning. The pr esent wor k also shows results in the pr ediction of mutations in DNA sequences of the HIVrever setr anscr iptase pr otein
Disciplinas: Ciencias de la computación,
Biología
Palabras clave: Procesamiento de datos,
Genética,
Secuencia génica,
Transcriptasa inversa,
Mutaciones,
Modelos de predicción,
Redes bayesianas,
Aprendizaje estructural
Keyword: Computer science,
Biology,
Data processing,
Genetics,
Gene sequence,
Reverse transcriptase,
Mutations,
Prediction models,
Bayesian networks,
Structural learning
Texto completo: Texto completo (Ver HTML)