Avaliação de Técnicas de Aumento de Dados para Classificação Binária de Imagens Volumétricas de Ressonância Magnética do Joelho
Resumo
A osteoartrite de joelho causa dor e perda funcional. Avaliamos aumento de dados para classificação binária de volumes de ressonância magnética na sequência double-echo steady-state (DESS) com o modelo R3D-18, em dez experimentos (EX1–EX10) com validação cruzada estratificada 5-fold e aumento de dados apenas no treino. Comparamos aprendizado por transferência (transfer learning), precisão mista automática (AMP) e transformações espaciais/radiométricas. A inicialização pré-treinada (EX1 vs. EX2) teve o maior efeito. A ablação da AMP (EX3) exigiu ajustes por limite de memória de vídeo (VRAM), demonstrando viabilidade, em vez de uma comparação controlada. O pico da AUC (área sob a curva ROC) foi 0,90 em EX8 e EX10.
Referências
Chlap, P., Min, H., Vandenberg, N., Dowling, J., Holloway, L., and Haworth, A. (2021). A review of medical image data augmentation techniques for deep learning applications. Journal of Medical Imaging and Radiation Oncology, v. 65, n. 5, p. 545–563.
Fontainha, T. C., Henriques, F. d. R., Lima, A. A., Araujo, G. M., and Tesch, R. d. S. (2025). Classificação binária de imagens de ressonância magnética de osteoartrite com o modelo r3d 18 modificado. In Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS), p. 1017–1022. SBC.
Guida, C., Zhang, M., and Shan, J. (2021). Knee osteoarthritis classification using 3D CNN and MRI. Applied Sciences, v. 11, n. 11, p. 5196.
Hara, K., Kataoka, H., and Satoh, Y. (2018). Can spatiotemporal 3D CNNs retrace the history of 2D CNNs and ImageNet? In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), p. 6546–6555, Salt Lake City, USA.
Islam, T., Hafiz, M. S., Jim, J. R., Kabir, M. M., and Mridha, M. (2024). A systematic review of deep learning data augmentation in medical imaging: Recent advances and future research directions. Healthcare Analytics, v. 5, p. 100340.
Kay, W., Carreira, J., Simonyan, K., Zhang, B., Hillier, C., Vijayanarasimhan, S., Viola, F., Green, T., Back, T., Natsev, P., et al. (2017). The kinetics human action video dataset. arXiv preprint arXiv:1705.06950.
Kazerouni, A., Aghdam, E. K., Heidari, M., Azad, R., Fayyaz, M., Hacihaliloglu, I., and Merhof, D. (2023). Diffusion models in medical imaging: A comprehensive survey. Medical image analysis, v. 88, p. 102846.
Kellgren, J. H., Lawrence, J., et al. (1957). Radiological assessment of osteo-arthrosis. Ann Rheum Dis, v. 16, n. 4, p. 494–502.
Kingma, D. P. and Ba, J. (2014). A method for stochastic optimization. arXiv preprint arXiv:1412.6980.
Kohn, M. D., Sassoon, A. A., and Fernando, N. D. (2016). Classifications in brief: Kellgren-lawrence classification of osteoarthritis. Clinical Orthopaedics and Related Research®, v. 474, n. 8, p. 1886–1893.
Krinski, B., Ruiz, D., and Todt, E. (2022). Light in the black: An evaluation of data augmentation techniques for COVID-19 CT’s semantic segmentation. In Anais do XXII Simpósio Brasileiro de Computação Aplicada à Saúde, p. 156–167, Porto Alegre, Brasil.
Montgomery, D. C. (2017). Design and analysis of experiments. John wiley & sons.
NIMH Data Archive (2026). The osteoarthritis initiative (OAI). [link]. Acesso em: 11 fev. 2026.
Peterfy, C. G., Schneider, E., and Nevitt, M. (2008). The osteoarthritis initiative: report on the design rationale for the magnetic resonance imaging protocol for the knee. Osteoarthritis and Cartilage, v. 16, n. 12, p. 1433–1441.
PyTorch (2026). torch.nn.functional.grid sample. [link]. Acesso em: 11 fev. 2026.
Ronneberger, O., Fischer, P., and Brox, T. (2015). U-net: Convolutional networks for biomedical image segmentation. In International Conference on Medical image computing and computer-assisted intervention, p. 234–241, Munich, Germany.
Scalercio, A. and Freitas, C. (2023). Proposta e avaliação linguística de técnicas de aumento de dados. In Anais do XIV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, p. 207–223, Porto Alegre, Brasil.
Shorten, C. and Khoshgoftaar, T. M. (2019). A survey on image data augmentation for deep learning. Journal of Big Data, v. 6, n. 1, p. 1–48.
Yeoh, P. S. Q., Lai, K. W., Goh, S. L., Hasikin, K., Wu, X., and Li, P. (2023). Transfer learning-assisted 3D deep learning models for knee osteoarthritis detection: Data from the osteoarthritis initiative. Frontiers in Bioengineering and Biotechnology, v. 11, p. 1164655.
Yun, S., Han, D., Oh, S. J., Chun, S., Choe, J., and Yoo, Y. (2019). Cutmix: Regularization strategy to train strong classifiers with localizable features. In Proceedings of the IEEE/CVF international conference on computer vision, p. 6023–6032, Seoul, South Korea.
Zhang, H., Cisse, M., Dauphin, Y. N., and Lopez-Paz, D. (2017). Mixup: Beyond empirical risk minimization. arXiv preprint arXiv:1710.09412.
