Permitindo Maior Reprodutibilidade de Experimentos em Ambientes Distribuídos com Nodos de Baixa Confiabilidade

  • Nelson Antônio Antunes Junior UFRGS
  • Weverton Luis da Costa Cordeiro UFRGS
  • Luciano Paschoal Gaspary UFRGS

Resumo


A reprodutibilidade de experimentos, essencial para a verificação da eficácia/eficiência de contribuições científicas, é particularmente desafiadora no contexto de sistemas distribuídos de larga escala. Falhas não programadas durante os experimentos (sejam nos nodos que fazem parte do sistema, ou de comunicação entre eles) podem dificultar a obtenção de significância estatística nos resultados, ou a verificação da validade dos mesmos. Para abordar esse problema propõe-se EASYEXP, uma arquitetura tolerante a falhas para garantir a reprodutibilidade de experimentos em testbeds distribuídos de baixa confiabilidade. No EASYEXP, nodos do ambiente de experimentação "interpretam" trabalhadores e executam ações previstas para os mesmos, seguindo o roteiro pré-definido para o experimento. Na falha de um nodo, substitui-se o mesmo por outro funcional, mantendo o contexto de execução do trabalhador interpretado por ele. Resultados obtidos mostram que o EASYEXP é capaz de manter menor variação (desvio padrão de 1.6%) e maior precisão (95.7%) entre múltiplas execuções de um mesmo experimento, quando comparado àqueles executados de forma tradicional (desvio de até 25% e precisão de apenas 72%).

Referências

Albrecht, J. and Huang, D. Y. (2010). Managing distributed applications using gush. In Int’l Conference on Testbeds and Research Infrastructures, pages 401–411. Springer.

Albrecht, J. R., Braud, R., Dao, D., Topilski, N., Tuttle, C., Snoeren, A. C., and Vahdat, A. (2007). Remote control: Distributed application conguration, management, and visualization with plush. In Large Installation System Administration (LISA), volume 7, pages 1–19.

Bajpai, V., Kühlewind, M., Ott, J., Schönwälder, J., Sperotto, A., and Trammell, B. In SIGCOMM Reproducibility Workshop, (2017). Challenges with reproducibility. Reproducibility ’17, pages 1–4, New York, NY, USA. ACM.

Baker, M. (2016). 1,500 scientists lift the lid on reproducibility. Nature, 533(7604):452– 454.

Bonaventure, O., Iannone, L., and Saucez, D. (2017). Proceedings of the ACM SIGCOMM Reproducibility Workshop. ACM, New York, NY, USA.

Costa, L. L., Bona, L. C., and Duarte Jr, E. P. (2015). Melhorando a precisão e repetibilidade de experimentos no planetlab. In Simpósio Brasileiro de Redes de Computadores e de Sistemas Distribuídos (SBRC 2015). SBC.

Garrett, T., Bona, L. C., and Duarte Jr, E. P. (2017).

Improving the performance and reproducibility of experiments on large-scale testbeds with k-cores. Computer Communications.

Hunt, P., Konar, M., Junqueira, F. P., and Reed, B. (2010). Zookeeper: Wait-free coordination for internet-scale systems. In USENIX Annual Technical Conference, volume 8, page 9. Boston, MA, USA.

Imbert, M., Pouilloux, L., Rouzaud-Cornabas, J., Lébre, A., and Hirofuchi, T. (2013). Using the execo toolkit to perform automatic and reproducible cloud experiments. In Int’l Conference on Cloud Computing Technology and Science (CloudCom 2013), volume 2, pages 158–163. IEEE.

Leonini, L., Riviére, íE., and Felber, P. (2009). Splay: Distributed systems evaluation made simple (or how to turn ideas into live systems in a breeze). In Networked Systems Design and Implementation (NSDI), volume 9, pages 185–198.

Nussbaum, L. (2017). Testbeds support for reproducible research. In SIGCOMM Reproducibility Workshop, Reproducibility ’17, pages 24–26, New York, NY, USA. ACM.

Ruiz, C. C., Richard, O. A., Iegorov, O., and Videau, B. (2013). Managing large scale experiments in distributed testbeds. In Int’l Association of Science and Technology for Development (IASTED), pages 628–636.

Santos, M., Fernandes, S., and Kamienski, C. (2014). Conducting network research in large-scale platforms: Avoiding pitfalls in planetlab. In Advanced Information Networking and Applications (AINA), pages 525–532. IEEE.
Publicado
10/05/2018
Como Citar

Selecione um Formato
ANTUNES JUNIOR, Nelson Antônio; CORDEIRO, Weverton Luis da Costa; GASPARY, Luciano Paschoal. Permitindo Maior Reprodutibilidade de Experimentos em Ambientes Distribuídos com Nodos de Baixa Confiabilidade. In: SIMPÓSIO BRASILEIRO DE REDES DE COMPUTADORES E SISTEMAS DISTRIBUÍDOS (SBRC), 36. , 2018, Campos do Jordão. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . p. 309-322. ISSN 2177-9384. DOI: https://doi.org/10.5753/sbrc.2018.2424.