Análise de desempenho das técnicas de vetorização, predicação e loads não temporais em processadores Skylake

  • Mateus Felipe Ferreira UFPR
  • Francis Moreira UFPR
  • Marco Antonio Alves UFPR
  • Arthur Krause UFRGS
  • Paulo Cesar Santos UFRGS

Resumo


Este trabalho avalia o desempenho, em termos de tempo de execução, de três técnicas de otimização de código. Embora as técnicas de vetorização de instruções e predicação demonstrem uma redução nesse tempo em cada benchmark proposto, a técnica de load não temporal, ao contrário do esperado, teve um desempenho inferior quando comparado com o modelo base proposto.

Referências

Barredo, A., Cebrian, J. M., Moretó, M., Casas, M., and Valero, M. (2020). Improving predication efficiency through compaction/restoration of simd instructions. In Int. Symp. on High Performance Computer Architecture.

Cooper, K. D. and Torczon, L. (2011). Engineering a Compiler, page 405. Elsevier.

Crawford, J., Doshi, G., Sailer, S. E., Fu, J. W. C., and Mathews, G. S. (1998). Method and apparatus for managing temporal and non-temporal data in a single cache structure. https://patents.google.com/patent/US6542966B1.

Gepner, P., Gamayunov, V., and Fraser, D. L. (2011). Early performance evaluation of avx for hpc. In Int. Conf. on Computational Science.

Intel (1998). Write combining memory implementation guidelines. https://download.intel.com/design/PentiumII/applnots/24442201.pdf.

Khartchenko, E. (2018). Vectorization: A key tool to improve performance on modern cpus. https://software.intel.com/content/dam/develop/external/us/en/documents/vectorization-performance-quantifi-755040.pdf.

Silc, J., Robi?c, B., and Ungerer, T. (1999). Processor Architecture: From Dataflow to Superscalar and Beyond, pages 146–148. Springer-Verlag Berlin Heidelberg.
Publicado
14/04/2021
Como Citar

Selecione um Formato
FERREIRA, Mateus Felipe; MOREIRA, Francis; ALVES, Marco Antonio; KRAUSE, Arthur; SANTOS, Paulo Cesar. Análise de desempenho das técnicas de vetorização, predicação e loads não temporais em processadores Skylake . In: ESCOLA REGIONAL DE ALTO DESEMPENHO DA REGIÃO SUL (ERAD-RS), 21. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 61-64. ISSN 2595-4164. DOI: https://doi.org/10.5753/eradrs.2021.14775.