Algoritmo Genético Assistido por Surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2

  • Elias A. D. Silva UFU / IFRO
  • Luiz G. A. Martins UFU
  • Murillo G. Carneiro UFU

Resumo


O design de peptídeos capazes de inibir a infecção viral tem sido considerado uma das estratégias potenciais para reduzir a transmissão do SARS-CoV-2. No entanto, a questão crítica para o design de peptídeos é o grande espaço de busca, o que torna inviável avaliar todas as possibilidades. Além disso, a maioria das análises relacionadas adota docking molecular in silico para selecionar potenciais peptídeos, que é uma técnica demorada e altamente dependente da estrutura molecular dos peptídeos já conhecidos e da proteína alvo. Com o objetivo de auxiliar na avaliação, descoberta e seleção de peptídeos para cálculo de docking, desenvolvemos o SAGAPEP, um framework de Algoritmo Genético Assistido por Surrogate capaz de encontrar peptídeos com potencial para bloquear a proteína Spike do SARS-CoV-2. O modelo surrogate é usado para avaliação rápida e de alta fidelidade da energia de interação entre um peptídeo e a proteína Spike, enquanto o algoritmo genético busca descobrir e selecionar peptídeos de alto potencial inspirados em princípios de genética e seleção natural. Os experimentos foram conduzidos usando um conjunto de dados composto por vários peptídeos potenciais obtidos por meio de docking molecular por especialistas em bioinformática. Como principais resultados, o SAGAPEP obteve baixas previsões de erro de seu componente surrogate treinado sobre esse conjunto de dados e foi capaz de descobrir e selecionar peptídeos com melhor energia de ligação do que todos listados no conjunto de dados. Além disso, os resultados notáveis do SAGAPEP sugerem que ele também pode ter o potencial de fornecer resultados promissores para outros problemas de design de peptídeos.

Referências

Caseiro, A., Ferreira, R., Padrão, A., Quintaneiro, C., Pereira, A., and Marinheiro, R. (2009). Mobyle: a new full web bioinformatics framework. Journal of Proteome Research, 25:3005–3011.

Chen, Z., Zhao, P., Li, C., Li, F., Xiang, D., Chen, Y.-Z., Akutsu, T., Daly, R. J., Webb, G. I., Zhao, Q., Kurgan, L., and Song, J. (2020). ilearnplus: a comprehensive and automated machine-learning platform for nucleic acid and protein sequence analysis, prediction and visualization. Nucleic Acids Research, 49.

Huang, S. and Zou, X. (2008). An iterative knowledge-based scoring function for proteinrotein recognition. Proteins, 72:557–579.

Johansson-Åkhe, I., Mirabello, C., and Wallner, B. (2018). Predicting protein-peptide interaction sites using distant protein complexes as structural templates. Biopolymers, 9.

Morris, G. and Lim-Wilby, M. (2008). Molecular docking. PKukol A. (eds) Molecular Modeling of Proteins. Methods Molecular Biology™, 443.

Nelson, D. L. and Cox, M. M. (2017). Lehninger Principles of Biochemistry, volume 7. Macmillan Higher Education Houndmills.

Néron, B., Ménager, H., Maufrais, C., Joly, N., Maupetit, J., Letort, S., Carrere, S., Tuffery, P., and Letondal, C. (2013). Salivary proteome and peptidome profiling in type 1 diabetes mellitus using a quantitative approach. Bioinformatics, 12:1700–1709.

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12:2825–2830.

Zhou, P., Jin, B., Li, H., and Huang, S. (2018). Hpepdock: a web server for blind peptide–protein docking based on a hierarchical algorithm. Nucleic Acids Res, 46:443–445.
Publicado
27/06/2023
SILVA, Elias A. D.; MARTINS, Luiz G. A.; CARNEIRO, Murillo G.. Algoritmo Genético Assistido por Surrogate para avaliar e descobrir peptídeos contra o SARS-CoV-2. In: PRÊMIO ARTUR ZIVIANI - CONCURSO DE TESES E DISSERTAÇÕES (MESTRADO) - SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 23. , 2023, São Paulo/SP. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 114-119. ISSN 2763-8987. DOI: https://doi.org/10.5753/sbcas_estendido.2023.229688.