Utilizando a biblioteca PAPI para avaliar diferentes abordagens de construção de curvas b-spline
Resumo
Tendo em vista a importância da paralelização de trechos do algoritmo, para a obtenção de desempenho, este artigo propõe a análise de desempenho para diferentes nı́veis de abordagens paralelas permitindo concluir a melhor abordagem para curvas B-spline. O desempenho foi avaliado utilizando diferentes nı́veis de paralelização, por meio de instruções, com a vetorização, e por meio de núcleos, através das threads. Nossos resultados demonstraram que uma abordagem através de núcleos obteve um aproveitamento muito bom enquanto que a vetorização não obteve ganhos.
Referências
Buss, S. R. (2003). 3D computer graphics: a mathematical introduction with OpenGL. Cambridge University Press.
Garner, B. D., Browne, S., Dongarra, J., Garner, N., Ho, G., and Mucci, P. (2000). A portable programming interface for performance evaluation on modern processors. The International Journal of High Performance Computing Applications, 14:189–204.
Kevin Stock, Louis-Noël Pouchet, P. S. (2012). Using machine learning to improve automatic vectorization. ACM Transactions on Architecture and Code Optimization (TACO) - Special Issue on High-Performance Embedded Architectures and Compilers, 8(50).
Peleg, A., Wilkie, S., and Weiser, U. (1997). Intel mmx for multimedia pcs. Communications of the ACM, 40(1):24–38.
Stallings, W. (2003). Computer organization and architecture: designing for performance. Pearson Education India.
Wolberg, G. (1990). Digital image warping, volume 10662. IEEE computer society press Los Alamitos, CA.