Utilização de modelos BERT em língua portuguesa para predição de códigos CID em contexto neonatal

  • Ricardo da S. Santos UNICAMP
  • Murilo G. Gazzola MACKENZIE
  • Renato T. Souza UNICAMP
  • Rodolfo C. Pacagnella UNICAMP
  • Cristiano Torezzan UNICAMP


A tarefa de prever códigos da Classificação Internacional de Doenças (CID) representa um desafio contemporâneo de pesquisa na área de inteligência artificial aplicada à saúde. Essa abordagem é vista como uma solução promissora para otimizar tarefas recorrentes de registros clínicos, aumentar a precisão de diagnósticos e aprimorar a tomada de decisões médicas. Uma previsão acurada de códigos CID pode permitir agilizar e automatizar processos administrativos em ambientes de saúde e contribuir para uma medicina mais personalizada e eficaz. Apesar da relevância desse tema, ainda existem poucas pesquisas para a predição do código CID em português brasileiro. Neste contexto, este trabalho apresenta resultados preliminares de uma pesquisa que está em desenvolvimento, com objetivo de treinar algoritmos para a predição de códigos CID no contexto da atenção primária neonatal, com foco na previsão dos códigos CID em admissões e relatórios de alta de internações pediátricas de recémnascidos. Os algoritmos utilizam modelos baseados em BERT - Representações Codificadoras Bidirecionais de Transformadores e os resultados preliminares indicam que o caminho é promissor, mas ainda há necessidade de ajustes para que se tenha uma aplicação que possa ser utilizada na prática clínica.


SANTOS, Ricardo da S.; GAZZOLA, Murilo G.; SOUZA, Renato T.; PACAGNELLA, Rodolfo C.; TOREZZAN, Cristiano. Utilização de modelos BERT em língua portuguesa para predição de códigos CID em contexto neonatal. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 24. , 2024, Goiânia/GO. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 681-686. ISSN 2763-8952. DOI: https://doi.org/10.5753/sbcas.2024.2802.