Abordagem Híbrida CNN-Mamba para Diagnóstico Computacional de Leucemias Agudas em Imagens Hematológicas

  • Gilclécio S. Morais IFPI
  • Gabriel C. Sousa IFPI
  • Maíla L. Claro IFPI
  • Rodrigo M. S. Veras UFPI
  • Julian R. Valerio IFPI
  • Selles G. F. C. Araújo IFPI
  • Clésio A. Gonçalves IFPI
  • José C. J. Silva IFPI

Resumo


A classificação automatizada de leucemias agudas por imagens de esfregaço sanguíneo é desafiadora devido à alta variabilidade morfológica causada por diferentes protocolos de coloração, dispositivos de aquisição e contextos multicêntricos. Embora Redes Neurais Convolucionais (CNNs) sejam eficazes na extração de características locais, apresentam limitações na modelagem de dependências espaciais globais em cenários heterogêneos. Este trabalho propõe uma arquitetura híbrida CNN–Mamba para classificação multiclasse utilizando o macro-dataset UNION, composto por 17 bases públicas e 3.157 amostras celulares. O modelo combina a extração local da MobileNetV2 pré-treinada com modelagem global baseada em Visual State Space Blocks (Mamba), permitindo capturar dependências estruturais com complexidade linear. O protocolo experimental incluiu validação cruzada estratificada, ponderação de classes e análise de 18 cenários controlados. O melhor modelo alcançou F1-score macro de 98, 6% e acurácia de 98, 7% em teste independente, superando baselines convolucionais e demonstrando maior robustez frente à heterogeneidade e à redução amostral. Os resultados indicam que arquiteturas híbridas CNN–State Space são uma alternativa promissora, escalável e robusta para sistemas de apoio ao diagnóstico hematológico assistido por inteligência artificial.

Referências

Chen, C.-S., Zhou, D., Chen, G.-Y., Jiang, D., and Chen, D.-S. (2024). Res-vmamba: Fine-grained food category visual classification using selective state space models with deep residual learning. arXiv preprint arXiv:2402.15761.

Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., et al. (2020). An image is worth 16x16 words: Transformers for image recognition at scale. arXiv preprint arXiv:2010.11929.

Gu, A. and Dao, T. (2024). Mamba: Linear-time sequence modeling with selective state spaces. In First conference on language modeling.

Hastie, T., Tibshirani, R., Friedman, J. H., and Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction, volume 2. Springer.

He, K., Zhang, X., Ren, S., and Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 770–778.

Hidayat, T., Hadinata, E., Damanik, I. S., Vikki, Z., and Irvanizam, I. (2023). An implementation of hybrid cnn-xgboost method for leukemia detection problem. Infolitika Journal of Data Science, 1(1):15–21.

Krizhevsky, A., Sutskever, I., and Hinton, G. E. (2012). Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems, 25.

Kuang, Z., Yan, X., Yu, J., Sun, D., Zhao, J., and Sun, L. (2026). Lbmnet: a hybrid multi-scale cnn–mamba framework for enhanced 3d stroke lesion segmentation in mri. Frontiers in Medicine, 13:1759114.

Labati, R. D., Piuri, V., and Scotti, F. (2011). All-idb: The acute lymphoblastic leukemia image database for image processing. In 2011 18th IEEE international conference on image processing, pages 2045–2048. IEEE.

Li, M., Jiang, Y., Zhang, Y., and Zhu, H. (2023). Medical image analysis using deep learning algorithms. Frontiers in public health, 11:1273253.

Liu, Y., Tian, Y., Zhao, Y., Yu, H., Xie, L., Wang, Y., Ye, Q., Jiao, J., and Liu, Y. (2024). Vmamba: Visual state space model. Advances in neural information processing systems, 37:103031–103063.

Ma, C. and Wang, Z. (2024). Semi-mamba-unet: Pixel-level contrastive and cross-supervised visual mamba-based unet for semi-supervised medical image segmentation. Knowledge-Based Systems, 300:112203.

Metz, C. E. (1978). Basic principles of roc analysis. In Seminars in nuclear medicine, volume 8, pages 283–298. Elsevier.

Powers, D. M. (2020). Evaluation: from precision, recall and f-measure to roc, informedness, markedness and correlation. arXiv preprint arXiv:2010.16061.

Saito, T. and Rehmsmeier, M. (2015). The precision-recall plot is more informative than the roc plot when evaluating binary classifiers on imbalanced datasets. PloS one, 10(3):e0118432.

Siegel, R. L., Miller, K. D., Wagle, N. S., and Jemal, A. (2023). Cancer statistics, 2023. CA: a cancer journal for clinicians, 73(1):17–48.

Steyerberg, E. W., Vickers, A. J., Cook, N. R., Gerds, T., Gonen, M., Obuchowski, N., Pencina, M. J., and Kattan, M. W. (2010). Assessing the performance of prediction models: a framework for traditional and novel measures. Epidemiology, 21(1):128–138.

Vogado, L. H., Veras, R. M., and Aires, K. R. (2020). ”leuknet-um modelo de rede neural convolucional para o diagnóstico de leucemia. Anais do ... Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS).

Yu, W. and Wang, X. (2024). Mambaout: Do we really need mamba for vision? arXiv preprint arXiv:2405.07992.

Yue, Y. and Li, Z. (2024). Medmamba: Vision mamba for medical image classification. arXiv preprint arXiv:2403.03849.

Zhu, L., Liao, B., Zhang, Q., Wang, X., Liu, W., and Wang, X. (2024). Vision mamba: Efficient visual representation learning with bidirectional state space model. arXiv preprint arXiv:2401.09417.
Publicado
01/06/2026
MORAIS, Gilclécio S.; SOUSA, Gabriel C.; CLARO, Maíla L.; VERAS, Rodrigo M. S.; VALERIO, Julian R.; ARAÚJO, Selles G. F. C.; GONÇALVES, Clésio A.; SILVA, José C. J.. Abordagem Híbrida CNN-Mamba para Diagnóstico Computacional de Leucemias Agudas em Imagens Hematológicas. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 26. , 2026, Ouro Preto/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2026 . p. 1086-1097. ISSN 2763-8952. DOI: https://doi.org/10.5753/sbcas.2026.21632.

Artigos mais lidos do(s) mesmo(s) autor(es)

1 2 > >>