Evaluación de la influencia de los recursos computacionales en la variabilidad y calidad de ensamblaje de novo de transcriptoma



Document title: Evaluación de la influencia de los recursos computacionales en la variabilidad y calidad de ensamblaje de novo de transcriptoma
Journal: Computación y sistemas
Database:
System number: 000560376
ISSN: 1405-5546
Authors: 1
1
1
1
2
1
Institutions: 1Instituto Politécnico Nacional, México
2Cambridge University, Genetics Department, UK
Year:
Season: Oct-Dic
Volumen: 22
Number: 4
Pages: 1595-1612
Country: México
Language: Español
Spanish abstract El contenido de ARN se descifra con fragmentación aleatoria, lo que genera millones de secuencias, que en ausencia de referencias se reconstruyen basándose en algoritmos que usan intensivamente recursos computacionales. Diversos factores afectan el resultado de dicho proceso. Este estudio considera por primera vez cómo la asignación de memoria/núcleos influye sobre la calidad y variabilidad del ensamblaje. Se realizaron múltiples ensamblajespara 2 organismos modelo, en una plataforma monolítica y dos de cómputo de alto desempeño. Se encontraron mayores variabilidades decontigsen equipos monolíticos con poca memoria (1.98 y 2.10 veces más que HPC); sin embargo, gran parte de estos (99.16% y 75.79%) mapearon al transcriptoma de referencia demostrando ser de calidad. Por tanto, contrariamente a lo esperado, se observó que una estrategia de ensamblajes múltiples en un equipo de bajos recursos supera el uso de plataformas de alto rendimiento para el descubrimiento de ARNs.
English abstract RNA content is deciphered by random fragmentation of biomolecules, generating millions of sequences. In lack of references these sequences are reconstructed relying on algorithms that require intensive use of computational resources. Numerous factors affect this process. This study explores for the first time how memory/core allocation on reconstruction processes influences assembly quality and variability. Multiple de novo assemblies for two model organisms were obtained from one monolithic platform and two High Performance Computers. Low memory monolithic platforms observed greater variability (1.98 & 2.10 times greater than HPC); however, most of the obtained contigs (99.16% & 75.79%) mapped to the reference transcriptome, thus proving good quality. Therefore, contrary to what was expected, using low-resource equipment when applying assembly strategies that unify numerous assemblies outperforms HPCs on RNA discovery.
Keyword: ARN,
Secuenciación NGS,
RNA-Seq,
Efecto de memoria en ensamblaje,
HPC,
Optimización de ensamblaje
Keyword: RNA,
NGS sequencing,
RNS-Seq,
Memory effect on assembly,
HPC,
Assembly optimization
Full text: Texto completo (Ver HTML) Texto completo (Ver PDF)