High performance computing architectures analysis for gene networks inference

  • Anderson Marco Universidade Federal do ABC
  • Mario Gazziro Universidade Federal do ABC
  • David Martins Jr Universidade Federal do ABC

Resumo


A modelagem e inferência de sistemas biológicos é uma importante área de pesquisa em ciência da computação, possuindo caracterı́sticas fortemente interdisciplinares. Nesse contexto, a inferência de redes de regulação gênica e a análise da dinâmica da expressão gerada pelas suas funções de transição são problemas relevantes. Tais problemas demandam muito poder computacional, já que algoritmos que buscam pela solução ótima possuem complexidade de tempo exponencial. Esta complexidade de tempo faz com que muitas análises sejam realizadas em redes gênicas com dezenas de genes e com cada gene tendo poucos preditores. Porém, uma rede gênica de tamanho real tipicamente possui milhares de genes, com alguns desses genes podendo ser hubs por terem um grau de entrada (número de preditores) bem acima da média. Desta forma é necessário buscar meios de acelerar o processamento da inferência de redes gênicas. Este artigo mostra uma comparação entre GPUs e FPGAs, duas arquiteturas computacionais de alto desempenho, na realização Abstraction Level

Referências

[Barrera et al. 2007] Barrera, J., Cesar-Jr, R. M., Martins-Jr, D. C., Vencio, R. Z. N., Merino, E. F., Yamamoto, M. M., Leonardi, F. G., Pereira, C. A. B., and del Portillo, H. A. (2007). Constructing probabilistic genetic networks of Plasmodium falciparum from dynamical expression signals of the intraerythrocytic development cycle. In Methods of Microarray Data Analysis V, chapter 2, pages 11–26. Springer.

[Borelli et al. 2013] Borelli, F. F., de Camargo, R. Y., Martins-Jr, D. C., and Rozante, L. C. S. (2013). Gene regulatory networks inference using a multi-gpu exhaustive search algorithm. BMC Bioinformatics, 14(S5).

[Carastan-Santos et al. 2017] Carastan-Santos, D., Camargo, R. Y., Martins-Jr, D. C., Song, S. W., and Rozante, L. C. S. (2017). Finding exact hitting set solutions for systems biology applications using heterogeneous gpu clusters. Future Generation Computer Systems, 67:418–429.

[Chickering 1996] Chickering, D. M. (1996). Learning Bayesian Networks is NP-Complete, pages 121–130. Springer New York, New York, NY.

[Cook 2018] Cook, S. (2018). CUDA Programming.

[Dougherty et al. 2009] Dougherty, E. R., Brun, M., Trent, J., and Bittner, M. L. (2009) A conditioning-based model of contextual regulation. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 6(2):310–320.

[Friedman et al. 2000] Friedman, N., Linial, M., Nachman, I., and Pe’er, D. (2000). Using Bayesian Network to Analyze Expression Data. Journal of Computational Biology, 7:601–620.

[Kauffman 1969] Kauffman, S. A. (1969). Metabolic stability and epigenesis in randomly constructed genetic nets. Journal of Theoretical Biology, 22(3):437–467.

[Lopes et al. 2008] Lopes, F. M., Martins-Jr, D. C., and Cesar-Jr, R. M. (2008). Feature selection environment for genomic applications. BMC Bioinformatics, 9(1):451.

[Martins-Jr et al. 2008] Martins-Jr, D. C., Braga-Neto, U., Hashimoto, R. F., Dougherty, E. R., and Bittner, M. L. (2008). Intrinsically multivariate predictive genes. IEEE Journal of Selected Topics in Signal Processing, 2(3):424–439.

[Munshi et al. 2018] Munshi, A., Gaster, B., Mattson, T. G., Fung, J., and Ginsburg, D. (2018). OpenCL Programming Guide.

[Pournara et al. 2005] Pournara, I., s. Bouganis, C., and Constantinides, G. A. (2005). Fpgaaccelerated bayesian learning for reconstruction of gene regulatory networks. In International Conference on Field Programmable Logic and Applications, 2005., pages 323–328.

[Shmulevich et al. 2002] Shmulevich, I., Dougherty, E. R., Kim, S., and Zhang, W. (2002) Probabilistic boolean networks: a rule-based uncertainty model for gene regulatory networks. Bioinformatics, 18(2):261–274.

[Vanderbauwhede and Benkrid 2013] Vanderbauwhede, W. and Benkrid, K. (2013). HighPerformance Computing Using FPGAs. Springer Publishing Company, Incorporated.
Publicado
08/11/2019
MARCO, Anderson; GAZZIRO, Mario; MARTINS JR, David. High performance computing architectures analysis for gene networks inference. In: SIMPÓSIO EM SISTEMAS COMPUTACIONAIS DE ALTO DESEMPENHO (SSCAD), 20. , 2019, Campo Grande. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 49-60. DOI: https://doi.org/10.5753/wscad.2019.8656.