Uma avaliação da Distribuição de Atividades Estática e Dinâmica em Ambientes Paralelos usando o Hydra
Resumo
Workflows Científicos são usados como uma abstração básica para estruturação e execução de experimentos científicos em diferentes ambientes computacionais. Estes workflows podem ser intensivos tanto computacionalmente quanto na manipulação de dados, exigindo computação de alto desempenho. A paralelização e distribuição adequada de atividades nestes ambientes influenciam o desempenho do workflow científico como um todo. Este trabalho avalia duas estratégias de distribuição (estática e dinâmica) de atividades utilizando o middleware Hydra integrado ao VisTrails. Nossos experimentos observaram que usar a estratégia adequada diminui a duração para distribuição de atividades em 30%.
Referências
Callahan, S. P., Freire, J., Santos, E., Scheidegger, C. E., Silva, C. T., Vo, H. T., (2006), "VisTrails: visualization meets data management". In: Proc. SIGMOD, p. 745-747, Chicago, Illinois, USA.
Deelman, E., Gannon, D., Shields, M., Taylor, I., (2009), "Workflows and e-Science: An overview of workflow system features and capabilities", Future Generation Computer Systems, v. 25, n. 5, p. 528-540.
Freedman, D., Pisani, R., Purves, R., (2007), Statistics, 4th Edition. 4 ed. W. W. Norton.
Mattoso, M., Werner, C., Travassos, G. H., Braganholo, V., Murta, L., Ogasawara, E., Oliveira, D., Cruz, S. M. S. da, Martinho, W., (2010), "Towards Supporting the Life Cycle of Large Scale Scientific Experiments", International Journal of Business Process Integration and Management , v. 5, n. 1, p. 79–92.
Meyer, L., Scheftner, D., Vöckler, J., Mattoso, M., Wilde, M., Foster, I., (2007), "An Opportunistic Algorithm for Scheduling Workflows on Grids", VECPAR 2006, 1 ed, p. 1-12.
Ogasawara, E., Oliveira, D., Chirigati, F., Barbosa, C. E., Elias, R., Braganholo, V., Coutinho, A., Mattoso, M., (2009), "Exploring many task computing in scientific workflows". In: MTAGS 09, p. 1-10, Portland, Oregon.
Raicu, I., Foster, I. T., Yong Zhao, (2008), "Many-task computing for grids and supercomputers". In: Workshop on Many-Task Computing on Grids and Supercomputers, p. 1-11, Austin, Texas.
Raicu, I., Zhao, Y., Dumitrescu, C., Foster, I., Wilde, M., (2007), "Falkon: a Fast and Light-weight tasK executiON framework". In: SC07, p. 1-12, Reno, Nevada.
Thain, D., Tannenbaum, T., Livny, M., (2002), "Condor and the Grid", Grid Computing: Making the Global Infrastructure a Reality. John Wiley & Sons Inc
Walker, E., Guiang, C., (2007), "Challenges in executing large parameter sweep studies across widely distributed computing environments". In: Workshop on Challenges of large applications in distributed environments, p. 11-18, Monterey, California, USA.
Wang, J., Crawl, D., Altintas, I., (2009), "Kepler + Hadoop: a general architecture facilitating data-intensive applications in scientific workflow systems". In: Proc. of the 4th Workshop on Workflows in Support of Large-Scale Science , p. 1-8, Portland, Oregon.
Weisstein, E. W., (2011), Gamma Distribution, Text, [link].
Zhao, Y., Hategan, M., Clifford, B., Foster, I., von Laszewski, G., Nefedova, V., Raicu, I., Stef-Praun, T., Wilde, M., (2007), "Swift: Fast, Reliable, Loosely Coupled Parallel Computation". In: Proc. of the 3rd IEEE World Congress on Services, p. 206, 199, Salt Lake City, USA.