Redes Bayesianas para Geração de Dados Totalmente Sintéticos para Alta do Recém-Nascido: Uma Proposta Metodológica Orientada a Conhecimento

  • Jean L. S. Santos UFS
  • Gilton J. F. da Silva UFS
  • Josielson C. da Silva UFBA

Resumo


O treinamento de modelos de IA na neonatologia esbarra na escassez de dados e nas restrições de privacidade. Os sistemas de apoio à decisão para a alta de recém-nascidos sofrem com o problema de cold start. Este trabalho propõe uma metodologia para a geração de dados totalmente sintéticos sem o uso de dados reais. A abordagem Human-in-the-loop traduz diretrizes clínicas em uma rede bayesiana geradora de ”pacientes virtuais”. A metodologia garante a coerência fisiológica implementando restrições determinísticas e gera rótulos de classificação de risco. Os resultados preliminares demonstram a topologia causal do modelo e propõem uma estrutura de validação com testes visuais de Turing, edit checks e métricas de utilidade de Machine Learning.

Referências

Acosta, J. N., Falcone, G. J., Rajpurkar, P., and Topol, E. J. (2022). Multimodal biomedical ai. Nature Medicine, 28:1773–1784.

Bowe, A. K., Lightbody, G., Staines, A., Murray, D. M., and Norman, M. (2023). Prediction of 2-year cognitive outcomes in very preterm infants using machine learning methods. JAMA Network Open, 6(4):e2349111.

Chen, R., Lu, M., Chen, T., Williamson, D., and Mahmood, F. (2021). Synthetic data in machine learning for medicine and healthcare. Nature Biomedical Engineering, 5:1–5.

Choi, E., Biswal, S., Malin, B., Duke, J., Stewart, W. F., and Sun, J. (2017). Generating multi-label discrete patient records using generative adversarial networks. In Machine Learning for Healthcare Conference, pages 286–305. PMLR.

El Emam, K., Mosquera, L., and Bass, J. (2020). Evaluating identity disclosure risk in fully synthetic health data: model development and validation. Journal of Medical Internet Research, 22(11):e23139.

El Emam, K., Mosquera, L., and Fang, X e El-Hussuna, A. (2022). Utility metrics for evaluating synthetic health data generation methods: validation study. JMIR Medical Informatics, 10:e35734.

Flores, C., Macagnan, F., Almeida, S., Galante, R., Bykowski, A., Alonso, E., and Oliveira, A. (2023). Sr-bayes: um framework para criação de sistemas de apoio à decisão clínica baseados em redes bayesianas. In Anais Estendidos do XXIII Simpósio Brasileiro de Computação Aplicada à Saúde, pages 186–191, Porto Alegre, RS, Brasil. SBC.

Gelatti, G., Rodrigues, P., and Carvalho, A. C. (2021). Detecção de anomalia através da comparação de modelos representativos. In Anais Estendidos do XXI Simpósio Brasileiro de Computação Aplicada à Saúde, pages 7–12, Porto Alegre, RS, Brasil. SBC.

Goncalves, A., Ray, P., Soper, B., Stevens, J., Coyle, L., and Sales, A. P. (2020). Generation and evaluation of synthetic patient data. BMC Medical Research Methodology, 20(108).

Jordon, J., Szpruch, L., Houssiau, F., Bottarelli, M., Cherubin, G., Maple, C., Cohen, S. N., and Weller, A. (2022). Synthetic data – what, why and how? arXiv preprint arXiv:2205.03257.

Landis, J. R. and Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics, 33(1):159–174.

Norori, N., Hu, Q., Aellen, F. M., Faraci, F. D., and Tzovara, A. (2021). Addressing bias in big data and ai for health care: A call for open science. Patterns, 2(10):100347.

Ortega-Leon, A., Urda, D., Turias, I. J., Lubián-López, S. P., and Benavente-Fernández, I. (2025). Machine learning techniques for predicting neurodevelopmental impairments in premature infants: a systematic review. Frontiers in Artificial Intelligence, 8:1481338.

Schreiber, J. (2018). pomegranate: fast and flexible probabilistic modeling in python. Journal of Machine Learning Research, 18(164):1–6.

Silva, C. T. d. S. (2024). Aplicativo para alta segura do recém-nascido. Tese de doutorado, Escola de Enfermagem, Universidade Federal da Bahia, Salvador, BA.

Sociedade Brasileira de Pediatria (2020). Recomendações para alta hospitalar do recém-nascido termo potencialmente saudável. Technical Report 7, Departamento Científico de Neonatologia – Sociedade Brasileira de Pediatria. Documento Científico.
Publicado
01/06/2026
SANTOS, Jean L. S.; SILVA, Gilton J. F. da; SILVA, Josielson C. da. Redes Bayesianas para Geração de Dados Totalmente Sintéticos para Alta do Recém-Nascido: Uma Proposta Metodológica Orientada a Conhecimento. In: SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 26. , 2026, Ouro Preto/MG. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2026 . p. 1529-1534. ISSN 2763-8952. DOI: https://doi.org/10.5753/sbcas.2026.21722.