A Segunda Geração de Computadores de Alto Desempenho da COPPE/UFRJ

  • C. L. Amorim UFRJ
  • R. Bianchini UFRJ
  • G. Silva UFRJ
  • R. Pinto UFRJ
  • M. Hor-Meyll UFRJ
  • M. De Maria UFRJ
  • L. Whately UFRJ
  • J. Assunção Jr. UFRJ


Sistemas de memória compartilhada distribuída (DSMs) podem ser implementados completamente em software. Esses sistemas, conhecidos como software DSMs, exibem um baixo custo e, portanto, representam uma alternativa atraente para computação paralela. Entretanto, software DSMs puros atingem alto desempenho numa classe restrita de aplicações. O sistema paralelo NCP2 introduz a segunda geração de computadores de alto desempenho da COPPE/UFRJ, a qual investiga a utilização de hardware simples e de baixo custo para otimizar software DSMs. Esse hardware consiste de controladores de protocolo programáveis que permitem a implementação de técnicas de tolerância à latência de comunicação e a overheads de processamento de coerência. Nossas simulações revelam que os nossos controladores de protocolo melhoram o desempenho de TreadMarks em 16 processadores em até 52%. Esses resultados sugerem que o NCP2 exibirá uma ótima relação custo/desempenho numa grande gama de aplicações, proporcionando uma opção tecnológica muito boa para investimentos nacionais em computação de alto desempenho.


A. Agarwal, R. Bianchini, D. Chaiken, K.L. Johnson, D. Kranz, J. Kubiatowicz, B.-H. Lim, K. Mackenzie, and D. Yeung. The MIT Alewife Machine: Architecture and Performance. In Proceedings of the 22nd Annual lnternational Symposium on Computer Architecture (ISCA). ACM, June 1995.

C. L. Amorim, R. Bianchini, G. Silva, R. Pinto, M. Hor-Meyll, M. De Maria, L. Whaterly, and J. Barros Jr. A segunda geração de computadores de alto desempenho da coppe/ufrj. Technical Report ES-391/96, COPPE Sistemas, Universidade Federal do Rio de Janeiro, Junho 1996. VIII Simp. de Arg. de Computadores e Proc. de Alto Desempenho

C. L. Amorim, R. Citro, A. Ferreira, and E. Chaves Filho. O sistema de computação paralela ncp i. In Anais do V Simpósio Brasileiro em Arquitetura de Computadores, SBAC-PAD, pages 89-99, July 1993.

R. Bianchini, L. Kontothanassis, R. Pinto, M. De Maria, M. Abud, and C.L. Amorim. Hiding communication latency and coherence overhead in software dsms. In Proceedings of the 7th International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS 7), October 1996.

J. B. Carter, J. K. Bennett, and W. Zwaenepoel. Implementation and performance of munin. In Proceedings of the 19th Symposium on Operating Systems Principles, October 1991.

D. Culler et al. Parallel programming in split-c. In Proceedings of Supercomputing '99, pages 262- 273, November 1993. 97

L. Iftode, C. Dubnicki, E. Felten, and K. Li. lmproving release-consistent shared virtual memory using automatic update. In Proceedings of the 2nd IEEE Symposium on High-Performance Computer Architecture, February 1996.

P. Keleher, A. L. Cox, and W. Zwaenepoel. Lazy release consistency for software distributed shared memory. In Proceedings of the 19th Annual International Symposium on Computer Architecture, pages 13-21, May 1992.

P. Keleher, S. Dwarkadas, A. Cox, and W. Zwaenepoel. Treadmarks: Distributed shared memory on standard workstations and operating systems. In Proceedings of the USENIX Winter '94 Technical Conference, pages 17-21, Jan 1994.

Kendall Square Research. KSR1 Principies of Operation, 1992.

J. Kuskin et al. The Stanford FLASH Multiprocessor. In Proceedings of the 1 st Annual lnternational Symposium on Computer Architecture, Chicago, IL, April 1994. IEEE.

D. Lenoski, J. Laudon, T. Joe, D. Nakahira, L. Stevens, A. Gupta, and J. Hennessy. The dash prototype: Logic overhead and performance. IEEE Transactions on Parallel and Distributed Systems, 4(1):41-61, Jan 1993.

Steven K. Reinhardt, James R. Larus, and David A. Wood. Tempest and Typhoon: User-Level Shared Memory. In Proceedings of the 21st Annual International Symposium on Computer Architecture, Chicago, IL, April 1994. IEEE.

G. Silva, M. Hor-Meyll, M. De Maria, R. Pinto, L. Whately, J. Barros Jr., R. Bianchini, and C. L. Amorim. O hardware do computador paralelo NCP2 da COPPE/UFRJ. Technical Report ES-394/96, COPPE Sistemas, Universidade Federal do Rio de Janeiro, Junho 1996.

J. E. Veenstra and R. J. Fowler. Mint: A front end for efficient simulation of shared-memory multiprocessors. In Proceedings of the 2nd International Workshop on Modeling, Analysis and Simulation of Gomputer and Telecommunication Systems (MASGOTS '94), 1994.

L. Whately, R. Pinto, G. Silva, M. Hor-Meyll, M. De Maria, J. Barros Jr., R. Bianchini, and C. L. Amorim. O software do computador paralelo NCP2 da COPPE/UFRJ. Technical Report ES-395/96, COPPE Sistemas, Universidade Federal do Rio de Janeiro, Junho 1996.

S. C. Woo, M. Ohara, E. Torrie, J. P. Singh, and A. Gupta. The splash-2 programa: Characterization and methodological considerations. In Proceedings of the 22nd Annual International Symposium on Computer Architecture, pages 24-36, May 1995.
AMORIM, C. L.; BIANCHINI, R.; SILVA, G.; PINTO, R.; HOR-MEYLL, M.; MARIA, M. De; WHATELY, L.; ASSUNÇÃO JR., J.. A Segunda Geração de Computadores de Alto Desempenho da COPPE/UFRJ. In: INTERNATIONAL SYMPOSIUM ON COMPUTER ARCHITECTURE AND HIGH PERFORMANCE COMPUTING (SBAC-PAD), 8. , 1996, Recife. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 1996 . p. 87-98. DOI: https://doi.org/10.5753/sbac-pad.1996.19817.