Predicción de Mutaciones en Secuencias de la Proteína Transcriptasa Inversa del VIH usando Nuevos Métodos para Aprendizaje Estructural de Redes Bayesianas



Document title: Predicción de Mutaciones en Secuencias de la Proteína Transcriptasa Inversa del VIH usando Nuevos Métodos para Aprendizaje Estructural de Redes Bayesianas
Journal: Avances en sistemas e informática
Database: PERIÓDICA
System number: 000351987
ISSN: 1657-7663
Authors: 1
1
1
1
1
1
1
Institutions: 1Universidad Central "Marta Abreu" de Las Villas, Centro de Estudios de Informática, Santa Clara, Villa Clara. Cuba
Year:
Season: Jun
Volumen: 5
Number: 2
Pages: 77-85
Country: Colombia
Language: Español
Document type: Artículo
Approach: Aplicado, descriptivo
Spanish abstract En el análisis de gr andes volúmenes de datos es cr ucial la relación entre las var iables. Una de las for mas de modelar tales r elaciones es usar una r ed bayesiana. El costo computacional del apr endizaje de una r ed bayesiana desde datos, crece con el número de var iables en la misma y con el número de casos, por consiguiente sur ge el problema de identifi car algor itmos efi cientes que aprendan desde los datos. En el tr abajo se proponen tr es nuevos métodos de aprendizaje estr uctur al de redes bayesianas, dos de ellos se basan en las r elaciones de dependencia entr e las var iables usando la pr ueba Chi cuadr ado y el último hace uso de heur ística mediante el algor itmo evolutivo Optimización de Enjambr e de Par tículas (PSO, de sus siglas en inglés: Par ticle Swar m Optimization). Los algor itmos pr opuestos se han pr obado con var ios conjuntos de datos de la UCI Repositor y de Machine Lear ning y en el tr abajo se muestr an resultados en la pr edicción de mutaciones en secuencias de ADN de la proteína tr anscr iptasa inver sa del VIH (Human Immunodefi ciency Vir us)
English abstract In the analysis of large volumes of data it is impor tant to take into account the relationship among var iables. One of the ways to model these r elations is given by the use of Bayesian Networ ks (BN). The computational cost of lear ning from data in BN, gr ows with the increase of the number of var iables and cases; therefore, it is impor tant to create effi cient algor ithms which lear n fr om data. Thr ee differ ent methods for str uctur al lear ning in BN are proposed in this paper. Two of them are based on the chisquare statistical test and the last one is based on a bioinspir ed technique: Par ticle Swar m Optimization. All the algor ithms have been tested using sever al datasets available on the UCI Repositor y of Machine Lear ning. The pr esent wor k also shows results in the pr ediction of mutations in DNA sequences of the HIVrever setr anscr iptase pr otein
Disciplines: Ciencias de la computación,
Biología
Keyword: Procesamiento de datos,
Genética,
Secuencia génica,
Transcriptasa inversa,
Mutaciones,
Modelos de predicción,
Redes bayesianas,
Aprendizaje estructural
Keyword: Computer science,
Biology,
Data processing,
Genetics,
Gene sequence,
Reverse transcriptase,
Mutations,
Prediction models,
Bayesian networks,
Structural learning
Full text: Texto completo (Ver HTML)