Cómputo de alto desempeño para operaciones vectoriales en BLAS-1



Título del documento: Cómputo de alto desempeño para operaciones vectoriales en BLAS-1
Revista: Publicaciones en ciencias y tecnología
Base de datos: PERIÓDICA
Número de sistema: 000398646
ISSN: 1856-8890
Autores: 1
2
3
Instituciones: 1Universidad de Guadalajara, Departamento de Ingeniería, Guadalajara, Jalisco. México
2Universidad Autónoma de Ciudad Juárez, Departamento de Electrónica y Computación, Ciudad Juárez, Chihuahua. México
3Instituto Nacional de Astrofísica, Optica y Electrónica, Departamento de Ciencias Computacionales, Tonantzintla, Puebla. México
Año:
Periodo: Ene-Jul
Volumen: 8
Número: 1
Paginación: 31-44
País: Venezuela
Idioma: Español
Tipo de documento: Artículo
Enfoque: Analítico
Resumen en español La biblioteca de funciones denominada Subprogramas Básicos de Algebra Lineal (BLAS-1) es considerada el estándar de programación en computación científica. En este trabajo nos enfocamos en el análisis de diversas técnicas de optimización de código para incrementar el desempeño computacional de BLAS-1. En particular abordamos un enfoque combinacional para explorar las posibles formas de codificación empleando la técnica de unroll con diversos niveles de profundidad, programación vectorial de datos con MMX y SSE para procesadores Intel. Empleando las funciones principales de BLAS-1 determinamos numéricamente un incremento computacional, expresado en mega-flops, de hasta 52 % en comparación con la biblioteca optimizada BLAS-1 de ATLAS
Resumen en inglés The functions library, called Basic Linear Algebra Subprograms (BLAS-1), is considered the programming standard in scientific computing. In this work, we focus on the analysis of various code optimization techniques to increase the computational performance of BLAS-1. In particular, we address a combinational approach to explore possible methods of encoding using unroll technique with different levels of depth, vector data programming with MMX and SSE for Intel processors. Using the main functions of BLAS-1, it was determined numerically a computational increase, expressed in mega-flops, up to 52 % compared to the optimized BLAS-1 ATLAS library
Disciplinas: Ciencias de la computación,
Matemáticas
Palabras clave: Programación,
Matemáticas aplicadas,
Cómputo de alto rendimiento,
Subprogramas básicos de álgebra lineal (BLAS),
Procesadores vectoriales
Keyword: Computer science,
Mathematics,
Programming,
Applied mathematics,
High performance computing,
Basic linear algebra subprograms (BLAS),
Vector processors
Texto completo: Texto completo (Ver PDF)