Revista: | Programación matemática y software |
Base de datos: | |
Número de sistema: | 000573090 |
ISSN: | 2007-3283 |
Autores: | Escalante Fol, Néstor Iván1 Portilla Flores, Alberto1 Vargas Solar, Genoveva2 Sánchez Pérez, Carolina Rocío1 Mora Lumbreras, Marva Angélica1 |
Instituciones: | 1Universidad Autónoma de Tlaxcala, Facultad de Ciencias Básicas, Ingeniería y Tecnología, Tlaxcala. México 2Centre National de la Recherche Scientifique, French-Mexican Laboratory of Informatics and Automatic Control, París. Francia |
Año: | 2015 |
Volumen: | 7 |
Número: | 2 |
Paginación: | 52-58 |
País: | México |
Idioma: | Español |
Tipo de documento: | Artículo |
Resumen en inglés | The main objective of this work concerns the processing of big data. Therefore repartition implementation algorithm is proposed to perform the join operation in a large data set, applying under the Map Reduce programming model. Implementing a join in the context of big data is complex and costly, therefore we use Hadoop platform, which provides the necessary tool for managing large volumes of information utilities to analyze the behavior of the algorithm and to evaluate its performance. The algorithm was tested in a cluster consisting of 3 nodes, analyzing the execution results for later use with real data. |
Resumen en español | El objetivo principal de este trabajo es el procesamiento de grandes volúmenes de información, conocidos como big data. Presentamos la implementación del algoritmo repartition join para realizar la operación join en un conjunto grande de datos. El algoritmo fue programado bajo el modelo de programación Map Reduce. Implementar un join en el contexto de big data resulta ser complejo y costoso; por ello, apoyados en la plataforma Hadoop, herramienta que ofrece las utilidades necesarias para el manejo de grandes volúmenes de información, analizamos el comportamiento del algoritmo para evaluar su rendimiento. El algoritmo planteado se evaluó en un clúster conformado por tres nodos. Los resultados de ejecución se analizaron para su posterior uso en aplicaciones con datos reales. |
Disciplinas: | Ciencias de la computación |
Palabras clave: | Procesamiento de datos |
Keyword: | Data processing |
Texto completo: | Texto completo (Ver PDF) |