Avaliação da quantização de modelos visuais de linguagem para implantação em ambiente hospitalar
Resumo
A implantação de modelos de Inteligência Artificial de ponta em hospitais é limitada por questões éticas e altos custos computacionais, especialmente para instituições menores e de países com restrições de recursos. Este estudo avalia a quantização como estratégia para viabilizar a execução local de Modelos de Visão e Linguagem (VLMs) para a interpretação de radiografias de tórax. Utilizando os modelos CheXagent, CheXagent 2 e MedGemma, aplicamos Quantização Pós-Treinamento (PTQ) de 4 bits e analisamos o trade-off entre acurácia (F1-Score), uso de memória (VRAM) e tempo de inferência. Os resultados mostram que a quantização reduziu drasticamente o uso de VRAM, com o MedGemma demonstrando menor perda de acurácia em relação ao CheXagent. O CheXagent 2, não quantizado, alcançou o maior desempenho e menor tempo de inferência. Embora o CheXagent 2 seja relativamente leve, seus requisitos de hardware ainda limitam a sua implantação e reforçam que a quantização é uma ferramenta viável para adaptar megamodelos avançados a possíveis limitações do ambiente clínico.Referências
K. Han, A. Xiao, E. Wu, J. Guo, C. Xu, and Y. Wang, “Transformer in Transformer,” Advances in Neural Information Processing Systems, vol. 34, pp. 15 908–15 919, 2021.
J. Kaplan, S. McCandlish, T. Henighan, T. B. Brown, B. Chess, R. Child, S. Gray, A. Radford, J. Wu, and D. Amodei, “Scaling laws for neural language models,” arXiv preprint arXiv:2001.08361, 2020.
H. Neumeier, The relation of hospital choices in IT infrastructure spending and deployment with HIT/EHR strategies and operational efficiency. The University of Alabama at Birmingham, 2013.
T. Brown, B. Mann, N. Ryder, M. Subbiah, J. D. Kaplan, P. Dhariwal, A. Neelakantan, P. Shyam, G. Sastry, A. Askell et al., “Language models are few-shot learners,” Advances in Neural Information Processing Systems, vol. 33, pp. 1877–1901, 2020.
A. Liu, B. Feng, B. Xue, B. Wang, B. Wu, C. Lu, C. Zhao, C. Deng, C. Zhang, C. Ruan et al., “DeepSeek-V3 technical report,” arXiv preprint arXiv:2412.19437, 2024.
Governo do Brasil, “Lei Geral de Proteção de Dados Pessoais (LGPD) - Lei nº 13.709, de 14 de agosto de 2018,” [link], 2018, acesso em: abr. 2025.
R. M. Gray and D. L. Neuhoff, “Quantization,” IEEE Transactions on Information Theory, vol. 44, no. 6, pp. 2325–2383, 1998.
H. Wu, P. Judd, X. Zhang, M. Isaev, and P. Micikevicius, “Integer quantization for deep learning inference: Principles and empirical evaluation,” arXiv preprint arXiv:2004.09602, 2020.
Z. Chen, M. Varma, J.-B. Delbrouck, M. Paschali, L. Blankemeier, D. Van Veen, J. M. J. Valanarasu, A. Youssef, J. P. Cohen, E. P. Reis et al., “CheXagent: Towards a foundation model for chest x-ray interpretation,” arXiv preprint arXiv:2401.12208, 2024.
Google, “MedGemma hugging face,” [link], 2025, accessed: 2025-06-20.
J. Irvin, P. Rajpurkar, M. Ko, Y. Yu, S. Ciurea-Ilcus, C. Chute, H. Marklund, B. Haghgoo, R. Ball, K. Shpanskaya et al., “CheXpert: A large chest radiograph dataset with uncertainty labels and expert comparison,” in Proceedings of the AAAI Conference on Artificial Intelligence, vol. 33, no. 01, 2019, pp. 590–597.
A. E. Johnson, T. J. Pollard, N. R. Greenbaum, M. P. Lungren, C.-y. Deng, Y. Peng, Z. Lu, R. G. Mark, S. J. Berkowitz, and S. Horng, “MIMIC-CXR-JPG, a large publicly available database of labeled chest radiographs,” arXiv preprint arXiv:1901.07042, 2019.
E. P. Reis, J. P. De Paiva, M. C. Da Silva, G. A. Ribeiro, V. F. Paiva, L. Bulgarelli, H. M. Lee, P. V. Santos, V. M. Brito, L. T. Amaral et al., “BRAX, Brazilian labeled chest x-ray dataset,” Scientific Data, vol. 9, no. 1, p. 487, 2022.
A. Smit, S. Jain, P. Rajpurkar, A. Pareek, A. Y. Ng, and M. P. Lungren, “CheXbert: Combining automatic labelers and expert annotations for accurate radiology report labeling using BERT,” arXiv preprint arXiv:2004.09167, 2020.
Y. LeCun, Y. Bengio, and G. Hinton, “Deep learning,” Nature, vol. 521, no. 7553, pp. 436–444, 2015.
J. Kaplan, S. McCandlish, T. Henighan, T. B. Brown, B. Chess, R. Child, S. Gray, A. Radford, J. Wu, and D. Amodei, “Scaling laws for neural language models,” arXiv preprint arXiv:2001.08361, 2020.
H. Neumeier, The relation of hospital choices in IT infrastructure spending and deployment with HIT/EHR strategies and operational efficiency. The University of Alabama at Birmingham, 2013.
T. Brown, B. Mann, N. Ryder, M. Subbiah, J. D. Kaplan, P. Dhariwal, A. Neelakantan, P. Shyam, G. Sastry, A. Askell et al., “Language models are few-shot learners,” Advances in Neural Information Processing Systems, vol. 33, pp. 1877–1901, 2020.
A. Liu, B. Feng, B. Xue, B. Wang, B. Wu, C. Lu, C. Zhao, C. Deng, C. Zhang, C. Ruan et al., “DeepSeek-V3 technical report,” arXiv preprint arXiv:2412.19437, 2024.
Governo do Brasil, “Lei Geral de Proteção de Dados Pessoais (LGPD) - Lei nº 13.709, de 14 de agosto de 2018,” [link], 2018, acesso em: abr. 2025.
R. M. Gray and D. L. Neuhoff, “Quantization,” IEEE Transactions on Information Theory, vol. 44, no. 6, pp. 2325–2383, 1998.
H. Wu, P. Judd, X. Zhang, M. Isaev, and P. Micikevicius, “Integer quantization for deep learning inference: Principles and empirical evaluation,” arXiv preprint arXiv:2004.09602, 2020.
Z. Chen, M. Varma, J.-B. Delbrouck, M. Paschali, L. Blankemeier, D. Van Veen, J. M. J. Valanarasu, A. Youssef, J. P. Cohen, E. P. Reis et al., “CheXagent: Towards a foundation model for chest x-ray interpretation,” arXiv preprint arXiv:2401.12208, 2024.
Google, “MedGemma hugging face,” [link], 2025, accessed: 2025-06-20.
J. Irvin, P. Rajpurkar, M. Ko, Y. Yu, S. Ciurea-Ilcus, C. Chute, H. Marklund, B. Haghgoo, R. Ball, K. Shpanskaya et al., “CheXpert: A large chest radiograph dataset with uncertainty labels and expert comparison,” in Proceedings of the AAAI Conference on Artificial Intelligence, vol. 33, no. 01, 2019, pp. 590–597.
A. E. Johnson, T. J. Pollard, N. R. Greenbaum, M. P. Lungren, C.-y. Deng, Y. Peng, Z. Lu, R. G. Mark, S. J. Berkowitz, and S. Horng, “MIMIC-CXR-JPG, a large publicly available database of labeled chest radiographs,” arXiv preprint arXiv:1901.07042, 2019.
E. P. Reis, J. P. De Paiva, M. C. Da Silva, G. A. Ribeiro, V. F. Paiva, L. Bulgarelli, H. M. Lee, P. V. Santos, V. M. Brito, L. T. Amaral et al., “BRAX, Brazilian labeled chest x-ray dataset,” Scientific Data, vol. 9, no. 1, p. 487, 2022.
A. Smit, S. Jain, P. Rajpurkar, A. Pareek, A. Y. Ng, and M. P. Lungren, “CheXbert: Combining automatic labelers and expert annotations for accurate radiology report labeling using BERT,” arXiv preprint arXiv:2004.09167, 2020.
Y. LeCun, Y. Bengio, and G. Hinton, “Deep learning,” Nature, vol. 521, no. 7553, pp. 436–444, 2015.
Publicado
30/09/2025
Como Citar
DOSSO, Rafael Scalabrin; CARMO, Diedre Santos do; RITTNER, Letícia.
Avaliação da quantização de modelos visuais de linguagem para implantação em ambiente hospitalar. In: WORKSHOP DE TRABALHOS DA GRADUAÇÃO - CONFERENCE ON GRAPHICS, PATTERNS AND IMAGES (SIBGRAPI), 38. , 2025, Salvador/BA.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 271-274.
