DeLIAP e DeLIAJ: Interfaces de biblioteca de dependabilidade em PAD para Python e Julia

  • Marcos Irigoyen UFRN
  • Carla Santana UFRN
  • Ramon C. F. Araújo UFRN
  • Samuel Xavier-de-Souza UFRN

Resumo


Para suprir a demanda de recursos computacionais em sistemas de processamento de alto desempenho contemporâneos, é comum o escalonamento horizontal de componentes. Em contrapartida, cada novo componente é um potencial ponto de falha, fazendo essencial o emprego de técnicas de tolerância a falhas. Nesse contexto, a biblioteca de tolerância a falhas DeLIA foi desenvolvida em C++ com capacidades de detecção e recuperação de falhas. Neste trabalho propomos estender as capacidades da DeLIA para Python e Julia através das interfaces DeLIAP e DeLIAJ e divulgamos resultados preliminares de seu uso para um programa de imageamento sísmico em Julia com cálculo do custo adicional mediano (1,4%) e relato de implementação.

Referências

Carvalho, P. T. C., da Silva, S. L. E. F., Duarte, E. F., Brossier, R., Corso, G., and de Araújo, J. M. (2021). Full waveform inversion based on the non-parametric estimate of the probability distribution of the residuals. Geophysical Journal International, 229(1):35–55.

Gorla, A., Jew, B., Zhang, L., and Sul, J. H. (2021). xgap: a python based efficient, modular, extensible and fault tolerant genomic analysis pipeline for variant discovery. Bioinformatics, 37(1):9–16.

Santana, C., Araújo, R. C., Sardina, I. M., Ítalo A.S. Assis, Barros, T., Bianchini, C. P., de S. Oliveira, A. D., de Araújo, J. M., Chauris, H., Tadonki, C., and de Souza, S. X. (2024). Delia: A dependability library for iterative applications applied to parallel geophysical problems. Computers & Geosciences, 191:105662.

Silva, G., Bianchini, C., and Costa, E. (2022). Programação Paralela e Distribuída com MPI, OpenMP e OpenACC para computação de alto desempenho. Aovs Sistemas de Informática.

Valiant, L. G. (1990). A bridging model for parallel computation. Communications of the ACM, 33(8):103–111.

Weber, T. S. (2003). Tolerância a falhas: conceitos e exemplos. Apostila do Programa de Pós-Graduação–Instituto de Informática-UFRGS. Porto Alegre, page 24.
Publicado
02/07/2025
IRIGOYEN, Marcos; SANTANA, Carla; ARAÚJO, Ramon C. F.; XAVIER-DE-SOUZA, Samuel. DeLIAP e DeLIAJ: Interfaces de biblioteca de dependabilidade em PAD para Python e Julia. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO NORDESTE (ERAD-NE), 6. , 2025, Natal/RN. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 1-4. DOI: https://doi.org/10.5753/erad-ne.2025.11365.