Modeling the Performance of Map Reduce Applications for the Cloud



Document title: Modeling the Performance of Map Reduce Applications for the Cloud
Journal: Latin-American Journal of Computing (LAJC)
Database: PERIÓDICA
System number: 000448824
ISSN: 1390-9134
Authors: 1
2
Institutions: 1Escuela Politécnica Nacional, Facultad de Ingeniería de Sistemas, Quito, Pichincha. Ecuador
2Universidade Federal do Rio Grande do Sul, Instituto de Informatica, Porto Alegre, Rio Grande do Sul. Ecuador
Year:
Volumen: 2
Number: 2
Pages: 41-48
Country: Ecuador
Language: Inglés
Document type: Artículo
Approach: Aplicado, descriptivo
Spanish abstract En los últimos años, Cloud Computing se ha convertido en una tecnología clave que ha hecho posible ejecutar aplicaciones sin la necesidad de utilizar una infraestructura física. El desafío de implementar aplicaciones distribuidas en ambientes de Cloud Computing es que la infraestructura de máquinas virtuales debe considerar aspectos relacionados con el costo y el tiempo de utilización. Este trabajo es el resumen de uno anterior, presentado por los autores como tesis de maestría, con el objetivo de demostrar que el tiempo de ejecución de una aplicación distribuida MapReduce, ejecutándose en un ambiente de Cloud Computing, puede ser predicho utilizando un modelo matemático basado en especificaciones teóricas. Esta predicción se realiza para ayudar a los usuarios de un ambiente de Cloud Computing a planificar sus implementaciones, es decir, cuantificar el número de máquinas virtuales y sus características. Después de medir el tiempo de ejecución de las aplicaciones y variando los parámetros establecidos por el modelo matemático, y seguidamente usando una técnica de regresión lineal, el objetivo se alcanza al encontrar un modelo del tiempo de ejecución que fue posteriormente aplicado para aplicaciones MapReduce. Los experimentos fueron realizados en diferentes configuraciones y mostraron una clara relación con el modelo teórico, mostrando que el modelo es capaz de predecir el tiempo de ejecución de aplicaciones MapReduce. El modelo desarrollado es genérico, es decir que usa abstracciones teóricas para la capacidad de cómputo del ambiente y el costo computacional de la aplicación MapReduce
English abstract In the last years, Cloud Computing has become akey technology that made possible to run applications withoutneeding to deploy a physical infrastructure. The challenge withdeploying distributed applications in Cloud Computing envi-ronments is that the virtual machine infrastructure should beplanned in a time and cost-effective way.This work is a summary of a previous work presented by theauthors as a Master’s thesis, with the goal of showing that theexecution time of a distributed MapReduce application, runningin a Cloud computing environment, can be predicted using amathematical model based on theoretical specifications. Thisprediction is made to help the users of the Cloud Computingenvironment to plan their deployments, i.e., quantify the numberof virtual machines and its characteristics. After measuring theapplication execution time and varying parameters stated in themathematical model, and after that, using a linear regressiontechnique, the goal is achieved finding a model of the executiontime which was then applied to predict the execution time ofMapReduce applications. Experiments were conducted in severalconfigurations and showed a clear relation with the theoreticalmodel, revealing that the model is in fact able to predict theexecution time of MapReduce applications. The developed modelis generic, meaning that it uses theoretical abstractions for thecomputing capacity of the environment and the computing costof the MapReduce application
Disciplines: Ciencias de la computación
Keyword: Redes,
Computación en nube,
Aplicaciones informáticas
Keyword: Networks,
Cloud computing,
Informatic applications
Full text: https://lajc.epn.edu.ec/index.php/LAJC/article/view/89/51