Geração de Dados Sintéticos com IA Generativa: Inovação Segura e Governança Alinhadas à LGPD e ao ECA Digital

  • Suerdo Flaubert C. de Lucena Júnior UFPB
  • Juliana Saraiva UFPB

Resumo


Este artigo apresenta um pipeline de software modular para geração de dados pessoais sintéticos com IA Generativa para testes, pesquisa e experimentação em IA, alinhado à LGPD e ao ECA Digital. A proposta combina identificadores fictícios determinísticos e uma GAN tabular para produzir perfis coerentes, com rastreabilidade, checagens de unicidade, controles de similaridade e validações semânticas. A utilidade foi avaliada por fidelidade estatística e consistência relacional, e a robustez por regras de plausibilidade. Os resultados sugerem redução de exposição de titulares quando a geração é tratada como gestão de risco e o código é disponibilizado publicamente para reprodutibilidade.

Referências

AUTORIDADE NACIONAL DE PROTEÇÃO DE DADOS (ANPD). Estudo técnico sobre a anonimização de dados na LGPD: análise jurídica (Versão 1.0). Brasília, DF: ANPD, 2023. Disponível em: [link]. Acesso em: 1 mar. 2026.

AUTORIDADE NACIONAL DE PROTEÇÃO DE DADOS (ANPD). Estudo técnico sobre a anonimização de dados na LGPD: uma visão de processo baseado em risco e técnicas computacionais (Versão 1.0). Brasília, DF: ANPD, 2023. Disponível em: [link]. Acesso em: 1 mar. 2026.

AUTORIDADE NACIONAL DE PROTEÇÃO DE DADOS (ANPD). Resolução nº 23, de 9 de dezembro de 2024. Aprova a Agenda Regulatória para o biênio 2025–2026. Diário Oficial da União: Seção 1, Brasília, DF, 11 dez. 2024. Disponível em: [link]. Acesso em: 1 mar. 2026.

AUTORIDADE NACIONAL DE PROTEÇÃO DE DADOS (ANPD). Radar Tecnológico nº 3: Inteligência Artificial Generativa. Brasília, DF: ANPD, nov. 2024. Disponível em: [link]. Acesso em: 1 mar. 2026.

BRASIL. Lei nº 13.709, de 14 de agosto de 2018. Lei Geral de Proteção de Dados Pessoais (LGPD). Diário Oficial da União: Seção 1, Brasília, DF, 15 ago. 2018. Disponível em: [link]. Acesso em: 1 mar. 2026.

BRASIL. Lei nº 15.211, de 17 de setembro de 2025. Dispõe sobre a proteção de crianças e adolescentes em ambientes digitais (Estatuto Digital da Criança e do Adolescente). Diário Oficial da União: Seção 1, Brasília, DF, 18 set. 2025. Disponível em: [link]. Acesso em: 1 mar. 2026.

CHEN, D.; YU, N.; ZHANG, Y.; FRITZ, M. GAN-Leaks: A Taxonomy of Membership Inference Attacks against Generative Models. arXiv:1909.03935, 2019. Disponível em: [link]. Acesso em: 1 mar. 2026.

CORRAL, Vitor Curiel Trentin. Gerador de dados sintéticos para testes de rotinas de record linkage para o contexto brasileiro. 2021. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) — Universidade Federal do Rio de Janeiro, Instituto de Matemática, Rio de Janeiro, 2021. Disponível em: [link]. Acesso em: 1 mar. 2026.

DELPORT, P. M. J.; VON SOLMS, R.; GERBER, M. Methodological Guidelines for Design Science Research. Procedia Computer Science, v. 237, p. 195–203, 2024. DOI: 10.1016/j.procs.2024.05.096. DOI: 10.1016/j.procs.2024.05.096. Acesso em: 1 mar. 2026.

GOODFELLOW, I. J.; POUGET-ABADIE, J.; MIRZA, M.; XU, B.; WARDE-FARLEY, D.; OZAIR, S.; COURVILLE, A.; BENGIO, Y. Generative Adversarial Nets. In: Advances in Neural Information Processing Systems (NeurIPS 2014). 2014. Disponível em: [link]. Acesso em: 1 mar. 2026.

GOYAL, M.; MAHMOUD, Q. H. A Systematic Review of Synthetic Data Generation Techniques Using Generative AI. Electronics, v. 13, n. 17, art. 3509, 2024. DOI: 10.3390/electronics13173509. Disponível em: [link]. Acesso em: 1 mar. 2026.

GUO, X.; CHEN, Y. Generative AI for Synthetic Data Generation: Methods, Challenges and the Future. arXiv:2403.04190, 2024. Disponível em: [link]. Acesso em: 1 mar. 2026.

HILPRECHT, B.; HÄRTERICH, M.; BERNAU, D. Monte Carlo and Reconstruction Membership Inference Attacks against Generative Models. Proceedings on Privacy Enhancing Technologies, v. 2019, n. 4, p. 232–249, 2019. DOI: 10.2478/popets-2019-0067. Disponível em: [link]. Acesso em: 1 mar. 2026.

JORDON, J.; YOON, J.; VAN DER SCHAAR, M. PATE-GAN: Generating Synthetic Data with Differential Privacy Guarantees. In: International Conference on Learning Representations (ICLR 2019). 2019. Disponível em: [link]. Acesso em: 1 mar. 2026.

PATKI, N.; WEDGE, R.; VEERAMACHANENI, K. The Synthetic Data Vault. In: 2016 IEEE International Conference on Data Science and Advanced Analytics (DSAA). 2016. p. 399–410. DOI: 10.1109/DSAA.2016.49. Disponível em: [link]. Acesso em: 1 mar. 2026.

STEIER, A.; RAMASWAMY, L.; MANOEL, A.; HAUSHALTER, A. Synthetic Data Privacy Metrics. arXiv:2501.03941, 2025. Disponível em: [link]. Acesso em: 1 mar. 2026.

STRZELECKI, A.; RIZUN, M. Consumers’ Change in Trust and Security after a Personal Data Breach in Online Shopping. Sustainability, v. 14, n. 10, art. 5866, 2022. DOI: 10.3390/su14105866. Disponível em: [link]. Acesso em: 1 mar. 2026.

XIE, L.; LIN, K.; WANG, S.; WANG, F.; ZHOU, J. Differentially Private Generative Adversarial Network. arXiv:1802.06739, 2018. Disponível em: [link]. Acesso em: 1 mar. 2026.

XU, L.; SKOULARIDOU, M.; CUESTA-INFANTE, A.; VEERAMACHANENI, K. Modeling Tabular Data Using Conditional GAN. arXiv:1907.00503, 2019. Disponível em: [link]. Acesso em: 1 mar. 2026.

ZHOU, Y.; MALIN, B.; KANTARCIOGLU, M. SMOTE-DP: Improving Privacy-Utility Tradeoff with Synthetic Data. arXiv:2506.01907, 2025. Disponível em: [link]. Acesso em: 1 mar. 2026.
Publicado
19/07/2026
LUCENA JÚNIOR, Suerdo Flaubert C. de; SARAIVA, Juliana. Geração de Dados Sintéticos com IA Generativa: Inovação Segura e Governança Alinhadas à LGPD e ao ECA Digital . In: WORKSHOP SOBRE AS IMPLICAÇÕES DA COMPUTAÇÃO NA SOCIEDADE (WICS), 7. , 2026, Gramado/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2026 . p. 171-185. ISSN 2763-8707. DOI: https://doi.org/10.5753/wics.2026.21274.