Avaliação do Paralelismo dos Kernels EP e CG em Sistemas Embarcados
Resumo
Nesse artigo, testamos o ganho de desempenho obtido ao implementar códigos com processamento paralelo em sistemas embarcados genéricos. Para analisar ao desempenho em relação ao Speedup ideal, foram testados dois algoritmos (EP e CG) paralelos em dois sistemas embarcados diferentes. Os resultados mostram uma discrepância entre o melhor (3.98X) e o pior (1.38X) desempenho obtidos, indicando o tamanho do espectrum de desempenho.
Referências
Belloch, J. A., Badía, J., León, G., Bank, B., and Välimäki, V. (2022). Multicore implementation of a multichannel parallel graphic equalizer. J. Supercomput., 78(14):15715-15729.
Ganssle, J. and Barr, M. (2003). Embedded Systems Dictionary. CRC Press.
Jiang, X., Chen, Z., Yang, M., Guan, N., Tang, Y., and Wang, Y. (2023). A unified blocking analysis for parallel tasks with spin locks under global fixed priority scheduling. IEEE Transactions on Computers, 72(1):15-28.
Löff, J., Griebler, D., Mencagli, G., and et al. (2021). The nas parallel benchmarks for evaluating c++ parallel programming frameworks on shared-memory architectures. Future Generation Computer Systems, 125:743-757.
Xu, F., Guo, Z., Chen, H., Ji, D., and Qu, T. (2022). A custom parallel hardware architecture of nonlinear model-predictive control on fpga. IEEE Transactions on Industrial Electronics, 69(11):11569-11579.