Ataques adversariais como estratégia de proteção de imagens femininas contra deepfakes: um desenho de pesquisa

Cléo Cunha Peixoto; Claudia Lage Rebello da Motta; Pedro Nuno de Souza Moura

doi:10.5753/sbsc_estendido.2026.20333

Cléo Cunha Peixoto Universidade Federal do Rio de Janeiro (UFRJ)
Claudia Lage Rebello da Motta Universidade Federal do Rio de Janeiro (UFRJ)
Pedro Nuno de Souza Moura Universidade Federal do Estado do Rio de Janeiro (UNIRIO)

DOI: https://doi.org/10.5753/sbsc_estendido.2026.20333

Resumo

A popularização de modelos generativos de Inteligência Artificial tem transformado o cotidiano das pessoas, viabilizando a produção de pornografia deepfake, a partir da apropriação de imagens pessoais sem consentimento. A narrativa predominante responsabiliza o indivíduo pelo uso inadequado da tecnologia. Este trabalho parte da teorização crítica de que a tecnologia não é neutra e, portanto, compreende os deepfakes como resultados esperados, em que grandes corporações se beneficiam com o lucro desta prática. Esta pesquisa investiga o uso de ataques adversariais para gerar perturbações em imagens faciais femininas a fim de inutilizá-las por modelos generativos, ampliando o debate sobre proteção em sistemas colaborativos.

Palavras-chave: ataques adversariais, deepfake, inteligência artificial, violência contra mulheres

Referências

Akter, S. and Ahmed, P. (2025). The emergence of ai-generated deepfakes as a new tool for gender-based violence against women: A brief narrative review of evidence and the implications of the techno-feminist perspective. 13:1–17.

Campante, R. G. (2024). Marx, allende e a rejeição do fatalismo tecnológico.

Dines, G. (2022). Pornland: como a indústria do sexo sequestrou nossa sexualidade. Caqui Livros, São Paulo. Tradução de Bruna Della Torre.

Goodfellow, I., Shlens, J., and Szegedy, C. (2014). Explaining and harnessing adversarial examples. arXiv 1412.6572.

Guo, Z., Qian, Y., Li, Y., Li, W., Lei, C. T., Zhao, S., Fang, L., Arandjelović, O., and Lau, C. P. (2025). Beyond vulnerabilities: A survey of adversarial attacks as both threats and defenses in computer vision systems.

Heusel, M., Ramsauer, H., Unterthiner, T., Nessler, B., and Hochreiter, S. (2017). Gans trained by a two time-scale update rule converge to a local nash equilibrium. In GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium.

Karkkainen, K. and Joo, J. (2021). Fairface: Face attribute dataset for balanced race, gender, and age for bias measurement and mitigation. In Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision, pages 1548–1558.

Karras, T., Laine, S., Aittala, M., Hellsten, J., Lehtinen, J., and Aila, T. (2019). Analyzing and improving the image quality of stylegan.

Kurakin, A., Goodfellow, I., and Bengio, S. (2016). Adversarial examples in the physical world.

Liang, H., He, E., Zhao, Y., Jia, Z., and Hao, l. (2022). Adversarial attack and defense: A survey. Electronics, 11:1283.

Madry, A., Makelov, A., Schmidt, L., Tsipras, D., and Vladu, A. (2017). Towards deep learning models resistant to adversarial attacks.

Marx, K. (2011). Fragmento sobre as máquinas. In Grundrisse: manuscritos de 1857-1858, pages aprox. 585–615. Boitempo, São Paulo. Parte dos manuscritos de 1857-1858.

Meira, S. (2024). Ia sabe demais: dados, algoritmos e o futuro da privacidade. Poder360. Acesso em: 10 fev. 2026.

Rombach, R., Blattmann, A., Lorenz, D., Esser, P., and Ommer, B. (2022). High-resolution image synthesis with latent diffusion models. In High-Resolution Image Synthesis with Latent Diffusion Models, pages 10674–10685.