Arquitetura de Aprendizado Federado para Adaptação Colaborativa de LLMs de Saúde: Estruturação de Dados Clínicos em HL7 FHIR
Resumo
A colaboração em saúde e o compartilhamento de inteligência clínica são limitados por silos de dados, regulações de privacidade e restrições computacionais. Este trabalho apresenta um desenho de pesquisa que propõe uma arquitetura de Aprendizado Federado (FL) para viabilizar a colaboração segura no treinamento de Grandes Modelos de Linguagem (LLMs) para a estruturação de dados. Integrando interoperabilidade semântica, como o HL7 FHIR, e adaptação eficiente por meio do QLoRA, a arquitetura proposta permite estabelecer confiança em redes distribuídas e promover a cooperação entre instituições de saúde heterogêneas, contribuindo para sistemas colaborativos. A arquitetura tem como foco preservar a soberania dos dados, validar a consistência semântica e mitigar alucinações.
Referências
Amar, F., April, A., and Abran, A. (2024). Electronic health record and semantic issues using fast healthcare interoperability resources: Systematic mapping review. Journal of Medical Internet Research, 26:e45209.
Corrêa, H. and Franco, M. (2025). Lei geral de proteção de dados (lgpd) na saúde: Tendências, desafios e oportunidades. In Anais da XXII Escola Regional de Redes de Computadores, pages 123–129, Porto Alegre, RS, Brasil. SBC.
Dettmers, T. et al. (2023). Qlora: Efficient finetuning of quantized large language models. In Advances in Neural Information Processing Systems (NeurIPS).
Eden, R. et al. (2025). A scoping review of the governance of federated learning in healthcare. npj Digital Medicine, 8:427.
Engelke, M. et al. (2025). Fhir-former: enhancing clinical predictions through fast healthcare interoperability resources and large language models. Journal of the American Medical Informatics Association, 32(12):1793–1801.
Franco, M. F., Soares, L. R., and Nobre, J. C. (2025). Saúde sob ataque: Da avaliação de riscos ao desenvolvimento de estratégias de investimentos em cibersegurança na área da saúde. In Anais do XXV SBCAS, pages 1–44. SBC.
Li, I. et al. (2022). Neural natural language processing for unstructured data in electronic health records: A review. Computer Science Review, 46:100511.
Li, Y. et al. (2023). Enhancing health data interoperability with large language models: A fhir study. arXiv preprint arXiv:2310.12989.
Liu, Z. et al. (2025). Large language models for automating clinical criteria conversion: validation and evaluation study. JMIR Medical Informatics, 13:e71252.
Rajpurkar, P. et al. (2022). Ai in health and medicine. Nature Medicine, 28:31–38.
Rieke, N. et al. (2020). The future of digital health with federated learning. NPJ Digital Medicine, 3(1):119.
Sedlakova, J. et al. (2023). Challenges and best practices for digital unstructured data enrichment in health research: A systematic narrative review. PLOS Digital Health, 2(10):e0000347.
Teo, Z. L. et al. (2024). Federated machine learning in healthcare: A systematic review of clinical applications and technical architecture. Cell Reports Medicine.
Wei, C. and Guan, H. (2024). Privacy-preserving federated learning in medical ai: A systematic review of techniques, challenges, and the clinical deployment gap. Artificial Intelligence and Machine Learning Review.
Xie, S. et al. (2025). Fedlodrop: Federated lora with dropout for generalized llm fine-tuning. arXiv preprint arXiv:2510.12078.
Yi, L. et al. (2023). Pfedlora: Model-heterogeneous personalized federated learning with lora tuning. arXiv preprint arXiv:2310.13283.
