Otimização de Parâmetros em Aplicações de Big Data Baseadas em Múltiplos Frameworks

  • Bruna de Mello Almeida Universidade Federal Fluminense
  • Yuri Frota Universidade Federal Fluminense
  • Daniel de Oliveira Universidade Federal Fluminense


Os sistemas de gerência de banco de dados e os frameworks de computação distribuída são cruciais para aplicações que processam grandes volumes de dados. Configurá-los manualmente é complexo devido à quantidade e interdependência dos parâmetros tanto em um mesmo framework quanto entre frameworks. As soluções automáticas atuais necessitam de muitos exemplos e não otimizam a integração entre sistemas. Este artigo avalia uma abordagem independente de modelo para otimizar parâmetros do Apache Spark e Cassandra de forma integrada. Os resultados mostram melhorias de até 69,99% com a otimização dos parâmetros de forma integrada, em comparação com os valores default de parâmetros.
Palavras-chave: Otimização de parâmetros, Spark, Cassandra, irace


ALMEIDA, Bruna de Mello; FROTA, Yuri; DE OLIVEIRA, Daniel. Otimização de Parâmetros em Aplicações de Big Data Baseadas em Múltiplos Frameworks. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 39. , 2024, Florianópolis/SC. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 418-430. ISSN 2763-8979. DOI: https://doi.org/10.5753/sbbd.2024.240405.