Proposta de Runtime em Nuvem Baseada em Atores e Tolerância a Falhas por Logs para Stream Processing em C++
Resumo
O Asynchronous Barrier Snapshotting (ABS) é um protocolo de tolerância a falhas, utilizado em sistemas de streaming. Entretanto, ele pode apresentar overhead de desempenho devido à algumas limitações de algoritmos de snapshot, como a necessidade de pausar e reiniciar toda a pipeline para recuperar o estado após a falha de um operador e a impossibilidade de escalar dinamicamente os operadores sem interromper a aplicação. O protocolo LOG.io surgiu como uma alternativa que resolve essas limitações apresentadas. Contudo, os resultados de desempenho obtidos indicaram que o LOG.io apresenta limitações em cenários com altas taxas de input de dados. Desse modo, este trabalho tem como objetivo implementar, no framework Resiflow, os protocolos ABS e LOG.io em uma runtime baseada em nuvem, a fim de analisar e comparar o impacto no desempenho de ambos sob diferentes cargas de dados e cenários de falha.Referências
Andrade, H. C., Gedik, B., and Turaga, D. S. (2014). Fundamentals of stream processing: application design, systems, and analytics. Cambridge University Press.
Armstrong, J. (2003). Making reliable distributed systems in the presence of software errors. PhD thesis.
Carbone, P., Fóra, G., Ewen, S., Haridi, S., and Tzoumas, K. (2015). Lightweight asynchronous snapshots for distributed dataflows. arXiv preprint arXiv:1506.08603.
Chandy, K. M. and Lamport, L. (1985). Distributed snapshots: Determining global states of distributed systems. ACM Transactions on Computer Systems (TOCS), 3(1):63–75.
Charousset, D., Hiesgen, R., and Schmidt, T. C. (2014). Caf-the c++ actor framework for scalable and resource-efficient applications. In Proceedings of the 4th International Workshop on Programming based on Actors Agents & Decentralized Control, pages 15–28.
Hewitt, C., Bishop, P., and Steiger, R. (1973). Session 8 formalisms for artificial intelligence a universal modular actor formalism for artificial intelligence. In Advance papers of the conference, volume 3, page 235. Stanford Research Institute Menlo Park, CA.
Murray, D. G., McSherry, F., Isaacs, R., Isard, M., Barham, P., and Abadi, M. (2013). Naiad: a timely dataflow system. In Proceedings of the Twenty-Fourth ACM Symposium on Operating Systems Principles, pages 439–455.
Simon, E., Hoffmann, R. B., Alf, L., and Griebler, D. (2025). Log. io: Unified roll-back recovery and data lineage capture for distributed data pipelines. arXiv preprint arXiv:2512.16038.
Armstrong, J. (2003). Making reliable distributed systems in the presence of software errors. PhD thesis.
Carbone, P., Fóra, G., Ewen, S., Haridi, S., and Tzoumas, K. (2015). Lightweight asynchronous snapshots for distributed dataflows. arXiv preprint arXiv:1506.08603.
Chandy, K. M. and Lamport, L. (1985). Distributed snapshots: Determining global states of distributed systems. ACM Transactions on Computer Systems (TOCS), 3(1):63–75.
Charousset, D., Hiesgen, R., and Schmidt, T. C. (2014). Caf-the c++ actor framework for scalable and resource-efficient applications. In Proceedings of the 4th International Workshop on Programming based on Actors Agents & Decentralized Control, pages 15–28.
Hewitt, C., Bishop, P., and Steiger, R. (1973). Session 8 formalisms for artificial intelligence a universal modular actor formalism for artificial intelligence. In Advance papers of the conference, volume 3, page 235. Stanford Research Institute Menlo Park, CA.
Murray, D. G., McSherry, F., Isaacs, R., Isard, M., Barham, P., and Abadi, M. (2013). Naiad: a timely dataflow system. In Proceedings of the Twenty-Fourth ACM Symposium on Operating Systems Principles, pages 439–455.
Simon, E., Hoffmann, R. B., Alf, L., and Griebler, D. (2025). Log. io: Unified roll-back recovery and data lineage capture for distributed data pipelines. arXiv preprint arXiv:2512.16038.
Publicado
06/05/2026
Como Citar
RODRIGUES, André L.; MARTINS, Eduardo M.; GRIEBLER, Dalvan.
Proposta de Runtime em Nuvem Baseada em Atores e Tolerância a Falhas por Logs para Stream Processing em C++. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 26. , 2026, Bagé/RS.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2026
.
p. 209-212.
ISSN 2595-4164.
DOI: https://doi.org/10.5753/eradrs.2026.21487.
