Análisis estadístico de los espectros de frecuencia de las regiones reguladoras del ENCODE



Título del documento: Análisis estadístico de los espectros de frecuencia de las regiones reguladoras del ENCODE
Revue: Revista mexicana de ingeniería biomédica
Base de datos: PERIÓDICA
Número de sistema: 000421693
ISSN: 0188-9532
Autores: 1
1
1
2
Instituciones: 1Universidad de Guadalajara, Centro Universitario de Ciencias Exactas e Ingenierías, Guadalajara, Jalisco. México
Año:
Periodo: Sep-Dic
Volumen: 38
Número: 3
País: México
Idioma: Español
Tipo de documento: Artículo
Enfoque: Experimental, aplicado
Resumen en español En la actualidad, nuevas bases de datos genómicos (secuencias de ADN) son puestas al alcance del dominio público para su análisis. La bioinformática ha desarrollado algoritmos para extraer información y características de dichas secuencias. Sin embargo, estos algoritmos bioinformáticos tienen limitaciones. Una alternativa es utilizar herramientas propias del procesamiento digital de señales (DSP) adaptadas a secuencias genómicas (procesamiento de señales genómicas - GSP). El presente trabajo versa sobre el análisis de los cuatro primeros momentos centrales (media, desviación estándar, asimetría y curtosis) y dos momentos estadísticos (mediana y varianza) de los espectros frecuenciales de las 15 Regiones Reguladoras (RRs) de la base de datos ENCODE con el objetivo de estudiar diferencias estadísticas y frecuencias características. La base de datos seleccionada es “mapeada”. Luego, la FFT es calculada a estas señales genómicas y finalmente los momentos estadísticos son implementados. Los resultados mues tran la existencia de 3 grupos de RRs utilizando la media, mediana y curtosis. La desviación estándar y la varianza, parecen no resaltar información importante. Finalmente, la asimetría revela un comportamiento homogéneo ante la presencia de valores atípicos en algunas RRs. Estas observaciones permiten inferir que la periodicidad dentro de la secuencia está relacionada o podría determinar la función biológica que desempeña la misma secuencia
Resumen en inglés Nowadays, new genomic databases (DNA sequences) are available to the whole scientist community for its analysis. The bioinformatics has developed algorithms to extract information and features of the sequences. However, the bioinformatics algorithms have restrictions. An alternative is the use of digital signal processing (DSP) tools adapted to genomic sequences (genomic signal processing - GSP). This work analyzes the first four statistics moments (mean, standard deviation, skewness and kurtosis) and other two moments (median and variance) of the frequency spectra of 15 regulatory regions (RRs) in ENCODE database with the main objective of studying the statistics di fferences and frequency features. The selected database is mapped. Then, the FFT is calculated to these genomic signals and finally the statistic moments implemented. The results show a three-group behavior in the RRs with the mean, median and kurtosis. The deviations standard and the variance do not show important behavior. Finally, the skewness shows a homogeneous behavior with the lack of atypical values in some RRs. These observations support the idea of the presence of periodicities in a sequence that may be related or may determine the biological function that a sequence may perform
Disciplinas: Medicina,
Ciencias de la computación
Palabras clave: Genética,
Bioinformática,
Señales genómicas,
Procesamiento de señales,
Análisis genómico,
Espectros de frecuencias,
Momentos estadisticos,
Transformada de Fourier
Keyword: Genetics,
Bioinformatics,
Genomic signals,
Signal processing,
Genomic analysis,
Frequency spectrum,
Statistical moments,
Fourier transform
Texte intégral: Texto completo (Ver HTML) Texto completo (Ver PDF)