Framework para alinhamento de seqüências biológicas com o auxílio de programação concorrente
Resumo
Este artigo apresenta um framework para implementação de algoritmos de alinhamento de seqüências biológicas, com o diferencial de oferecer suporte à execução concorrente. O objetivo do trabalho é oferecer recursos computacionais que facilitem a extração de informações estruturais, funcionais e evolucionárias de pares de seqüências de DNA ou proteínas em ambiente de processamento paralelo. A avaliação dos resultados obtidos foi realizada através da implementação de algoritmos que utilizam o método de programação dinâmica e por uma análise de desempenho. O artigo é complementado por uma análise do uso do modelo de programação de Anahy e de seu núcleo executivo.
Referências
Alves, C. E. R. Caceres, E. N., Dehne, F. e Song, S. W. "A Parallel Wavefront Algorithm for Efficient Biological Sequence Comparison", Proc. of Inter. Conf on Comput. Science and its Applic., Montreal, May 18-21, Lecture Notes in Computer Science, 2003, 2668:249-258.
Benitez, E. D., Dall'Agnol, E. C., Villa Real, L. C., Cardozo Jr, M. A. e Cavalheiro, G. G. H. "Avaliação de desempenho de Anahy em aplicações paralelas", Anais WPerformance, Salvador, 2004. (A ser publicado)
Blumofe, R. D., Joerg, C. F., Kuszmaul, B. C., Leiserson, C. E., Randall, K. H e Zhou, Y. "Cilk: an efficient multithreaded runtime system", ACM SIG-PLAN Notices, 30(8):207-216, Agosto, 1995.
Cavalheiro, G. G. H. "Introdução à Programação Paralela e Distribuída", Anais da 1ª. Escola Regional de Alto Desempenho, Gramado, janeiro, 2001, pp. 35-74.
Cavalheiro, G. G. H., Dall'Agnol, E. C. e Villa Real, L. C. "Uma biblioteca de Processos Leves para a Implementação de Aplicações Altamente Paralelas", Anais do IV Workshop de Sistemas Computacionais de Alto Desempenho, São Paulo, 2003.
Cavalheiro, G. G. H., Denneulin, Y. e J.-L. Roch. "A General Modular Specification for Distributed Schedulers", Lecture Notes in Computer Science, 1470:373-??, 1998.
Dall'Agnol, E. C. e Cavalheiro, G. G. H. "Biblioteca de comunicação com mensagens ativas", Anais da 4ª. Escola Regional de Alto Desempenho, Pelotas, 2003.
Dall'Agnol, E. C., Villa Real, L. C., Benitez, E. D. e Cavalheiro, G. G. H. "Portabilidade na programação para o processamento de alto desempenho", Anais do IV Workshop de Sistemas Computacionais de Alto Desempenho, São Paulo, 2003.
Fayad, M. A. et ai. "Building Application Frameworks Object Oriented Foundations of Framework Design", John Wiley & Sons: New York, 1999. 688 p. Foz do Iguaçu, 27 a 29 de Outubro de 2004
Fayad, M. e Schmidt, D. C. "Object Oriented Application Frameworks", Comm. of the ACM. 10(40), Outubro, 1997.
Gallilée, F., Roch, J.-L., Cavalheiro, G. G. H. e Doreille, M. "Athapascan-1: On-Line Building Data Flow Graph in a Parallel Language", Proceedings of the 1998 International Conference on Parallel Architectures and Compilation Techniques (PACT98), IEEE Computer Society Press, Paris, outubro, 1998, pp. 88-95.
Gusfield, D. "Aigorithms on strings, trees and sequences: computer science and molecular biology", Cambridge University: New York, 1997, 534p.
Martins, W. S., Del Cuvillo, J. B.. Useche. F. J., Theobald, K. B. e Gao, G. R. "A multithreaded parallel implementation of a dynamic programming algorithm for Sequence Comparison", Proc. of Pacific Symposium on Biocomputing, 6:311-322, 2001.
Moschetta, E., Osório, F. S. e Cavalheiro, G. G. H. "Reconhecimento de imagens em aplicações críticas", Anais do Workshop de Sistemas Computacionais de Alto Desempenho, Vitória, 2002.
Mount, D. W. "Bioinformatics: sequence and genome analysis", Cold Spring Harbor Laboratory, New York, 2001, 564 p. 128
Needleman S. B. e Wunsch C. D. "A general method applicable to the search for similarities in the amino acid sequence of two proteins", Journal of Molecular Biology. Março, 48(3):443-53, 1970.
Rice, P., Longden, I. e Bleasby, A. "EMBOSS: The European Molecular Biology Open software Suite". Trends in Genetics. Junho, 16(6):276-277, 2000.
Schmidt, B. Schröder, H. e Schimmler, M. "Massively parallel solutions for molecular sequence Analysis", Proc. of the International Parallel and Distributed Processing Symposium, IEEE, 2002.
Smith, T. F. e Waterman. M. "ldentification of common molecular subsequences", Journal of Molecular Biology, 147:195-197, 1981.
Yap, T. K., Frieder, O. e Martino, R. L. "Parallel computation in biological sequence analysis". IEEE Trans. on Par. and Distrib. Syst., 9(3):283-294, 1998.