Análisis estadístico de los espectros de frecuencia de las regiones reguladoras del ENCODE



Document title: Análisis estadístico de los espectros de frecuencia de las regiones reguladoras del ENCODE
Journal: Revista mexicana de ingeniería biomédica
Database: PERIÓDICA
System number: 000421693
ISSN: 0188-9532
Authors: 1
1
1
2
Institutions: 1Universidad de Guadalajara, Centro Universitario de Ciencias Exactas e Ingenierías, Guadalajara, Jalisco. México
Year:
Season: Sep-Dic
Volumen: 38
Number: 3
Country: México
Language: Español
Document type: Artículo
Approach: Experimental, aplicado
Spanish abstract En la actualidad, nuevas bases de datos genómicos (secuencias de ADN) son puestas al alcance del dominio público para su análisis. La bioinformática ha desarrollado algoritmos para extraer información y características de dichas secuencias. Sin embargo, estos algoritmos bioinformáticos tienen limitaciones. Una alternativa es utilizar herramientas propias del procesamiento digital de señales (DSP) adaptadas a secuencias genómicas (procesamiento de señales genómicas - GSP). El presente trabajo versa sobre el análisis de los cuatro primeros momentos centrales (media, desviación estándar, asimetría y curtosis) y dos momentos estadísticos (mediana y varianza) de los espectros frecuenciales de las 15 Regiones Reguladoras (RRs) de la base de datos ENCODE con el objetivo de estudiar diferencias estadísticas y frecuencias características. La base de datos seleccionada es “mapeada”. Luego, la FFT es calculada a estas señales genómicas y finalmente los momentos estadísticos son implementados. Los resultados mues tran la existencia de 3 grupos de RRs utilizando la media, mediana y curtosis. La desviación estándar y la varianza, parecen no resaltar información importante. Finalmente, la asimetría revela un comportamiento homogéneo ante la presencia de valores atípicos en algunas RRs. Estas observaciones permiten inferir que la periodicidad dentro de la secuencia está relacionada o podría determinar la función biológica que desempeña la misma secuencia
English abstract Nowadays, new genomic databases (DNA sequences) are available to the whole scientist community for its analysis. The bioinformatics has developed algorithms to extract information and features of the sequences. However, the bioinformatics algorithms have restrictions. An alternative is the use of digital signal processing (DSP) tools adapted to genomic sequences (genomic signal processing - GSP). This work analyzes the first four statistics moments (mean, standard deviation, skewness and kurtosis) and other two moments (median and variance) of the frequency spectra of 15 regulatory regions (RRs) in ENCODE database with the main objective of studying the statistics di fferences and frequency features. The selected database is mapped. Then, the FFT is calculated to these genomic signals and finally the statistic moments implemented. The results show a three-group behavior in the RRs with the mean, median and kurtosis. The deviations standard and the variance do not show important behavior. Finally, the skewness shows a homogeneous behavior with the lack of atypical values in some RRs. These observations support the idea of the presence of periodicities in a sequence that may be related or may determine the biological function that a sequence may perform
Disciplines: Medicina,
Ciencias de la computación
Keyword: Genética,
Bioinformática,
Señales genómicas,
Procesamiento de señales,
Análisis genómico,
Espectros de frecuencias,
Momentos estadisticos,
Transformada de Fourier
Keyword: Genetics,
Bioinformatics,
Genomic signals,
Signal processing,
Genomic analysis,
Frequency spectrum,
Statistical moments,
Fourier transform
Full text: Texto completo (Ver HTML) Texto completo (Ver PDF)