Teste de Resiliência do Celery: Uma Abordagem Experimental com Injeção de Falhas

Resumo


A execução confiável de tarefas assíncronas é essencial para garantir a eficiência e a escalabilidade de sistemas distribuídos em larga escala. Nesse contexto, o Celery se destaca como uma das ferramentas mais utilizadas em aplicações Python para o processamento de tarefas em segundo plano, oferecendo uma abordagem prática e direta para a construção de sistemas robustos. No entanto, sistemas de filas de tarefas como o Celery frequentemente enfrentam gargalos de desempenho que só se manifestam sob cargas reais de trabalho. Diante disso, os testes de resiliência surgem como uma estratégia eficaz para antecipar possíveis falhas, por meio da injeção controlada de erros e da análise do comportamento resultante do sistema. Atualmente, o Celery não oferece suporte nativo para esse tipo de teste, o que dificulta a análise de seu comportamento em ambientes críticos. Nesse cenário, este trabalho propõe uma avaliação experimental da resiliência do Celery por meio da injeção de falhas controladas. Os resultados indicam que, com as configurações adequadas, a ferramenta é capaz de manter a continuidade do processamento e demonstrar um bom nível de resiliência mesmo sob alta demanda, evidenciando seu potencial como uma solução robusta e confiável para a execução de tarefas assíncronas.

Palavras-chave: Resiliência de Sistemas, Injeção de Falhas, Tarefas Assíncronas

Referências

Ali Basiri, Niosha Behnam, Ruud de Rooij, Lorin Hochstein, Luke Kosewski, Justin Reynolds, and Casey Rosenthal. 2016. Chaos Engineering. IEEE Software 33, 3 (2016), 35–41. DOI: 10.1109/MS.2016.60

Broadcom. 2025. RabbitMQ Documentation. [link] Acesso em: 27 mar. 2025.

Celery Project. 2023. Celery Documentation. [link] Acesso em: 27 mar. 2025.

Celery Project. 2025. Celery - Distributed Task Queue. [link] Acesso em: 27 mar. 2025.

Grafana Labs. 2025. Grafana Documentation. [link] Acesso em: 27 mar. 2025.

Gremlin. 2025. What is Chaos Engineering? [link] Acesso em: 27 mar. 2025.

Mher Movsisyan. 2023. Flower: Celery monitoring tool. [link]. Acesso em: 27 mar. 2025.

Prometheus Authors. 2025. Prometheus Documentation. [link] Acesso em: 27 mar. 2025.

Sebastián Ramírez. 2025. FastAPI Documentation. [link] Acesso em: 27 mar. 2025.

Redis Project. 2025. Redis Documentation. [link] Acesso em: 27 mar. 2025.

Casey Rosenthal and Nora Jones. 2020. Chaos engineering: system resiliency in practice. O’Reilly Media.

Nagaraju Thallapally. 2025. Enhancing Distributed Systems with Message Queues: Architecture, Benefits, and Best Practices. Journal of Electrical Systems (3 2025). Issue Vol. 21 No. 1s (2025). [link]

Amos Waterland. 2008. stress - a workload generator for POSIX systems. [link]
Publicado
22/09/2025
LIMA, Pedro; MIRANDA, Breno. Teste de Resiliência do Celery: Uma Abordagem Experimental com Injeção de Falhas. In: SIMPÓSIO BRASILEIRO DE TESTES DE SOFTWARE SISTEMÁTICO E AUTOMATIZADO (SAST), 10. , 2025, Recife/PE. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 124-130. DOI: https://doi.org/10.5753/sast.2025.14465.