Uma Abordagem de Aprendizado de Máquina para Avaliar Políticas de Privacidade em um Contexto de Desenvolvimento de Sistemas de Informação com Privacidade por design
Resumo
A adoção da ”Privacidade por Design”tornou-se essencial no desenvolvimento de sistemas de informação devido à LGPD, exigindo a incorporação da privacidade desde as fases iniciais do desenvolvimento. No entanto, as políticas de privacidade costumam ser extensas e complexas, dificultando sua compreensão e aplicação prática, o que pode comprometer a conformidade legal. Para solucionar esse problema, este estudo propõe uma abordagem baseada em aprendizado de máquina para avaliar e melhorar a transparência dessas políticas. A metodologia incluiu a análise de 23 políticas e a aplicação de diferentes algoritmos para avaliar sua clareza e adequação legal. O melhor algoritmo apresentou 81% de eficácia, enquanto a ferramenta desenvolvida atingiu 72,7% na avaliação das políticas em conformidade com ”Privacidade por Design”. Os resultados mostram que a ferramenta pode auxiliar desenvolvedores na implementação de requisitos de privacidade desde o início dos projetos. Assim, este estudo reforça o uso de aprendizado de máquina para integrar privacidade ao ciclo de vida do software.Referências
(2018). Lei geral de proteção de dados pessoais. [link].
Cejas, O. A., Abualhaija, S., and Briand, L. C. (2024). Compai: A tool for gdpr completeness checking of privacy policies using artificial intelligence. In Proc. of the 39th IEEE/ACM International Conference on Automated Software Engineering, ASE ’24, page 2366–2369, New York, NY, USA. Association for Computing Machinery.
de Paula, R. F. O. (2022). Utilizando processamento de linguagem natural para avaliar políticas de privacidade. Trabalho de Graduação. Centro de Informática, UFPE.
Devlin, J., Chang, M. W., Lee, K., and Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2019).
Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and Tensor-Flow: Concepts, Tools, and Techniques to Build Intelligent Systems. O’Reilly Media, 2nd edition.
Herold, R. (2015). The Privacy Papers: Managing Technology, Consumer, Employee, and Legislative Actions. Auerbach Publications, 1st edition.
Khalid, H. and Mehmood, A. (2019). Sentiment analysis of product reviews using machine learning techniques. In 2019 2nd International Conference on Intelligent Sustainable Systems (ICISS), pages 324–327. IEEE.
Li, F., Li, Q., Yang, W., and Zhang, S. (2021). Automatic privacy policy analysis and its legal implications. IEEE Transactions on Information Forensics and Security, 16:1267–1278.
Manning, C. D. and Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press.
Peixoto, M., Ferreira, D., Cavalcanti, M., Silva, C., Vilela, J., Araújo, J., and Gorschek, T. (2023). The perspective of brazilian software developers on data privacy. Journal of Systems and Software, 195:111523.
Santana, E., Vilela, J., and Peixoto, M. (2022). Diretrizes para apresentação de políticas de privacidade voltadas à experiência do usuário. In WER 2022.
Singh, R. I., Sumeeth, M., and Miller, J. (2011). Evaluating the readability of privacy policies in mobile environments. Intl. Journal of Mobile HCI (IJMHCI), 3(1):55–78.
Sinha, A., Sharma, A., and Jha, S. (2018). Identifying ptsd symptoms using twitter data: A microblogging platform-based machine learning approach. In 2018 2nd Intl. Conference on Trends in Electronics and Informatics (ICOEI), pages 1097–1101. IEEE.
Solove, D. J. (2015). Understanding Privacy. Harvard University Press, 1st edition.
Terra, A., Vilela, J., and Peixoto, M. (2022). A catalog of quality criteria to guide the assessment of applications’ privacy policies. In WER 2022.
Zimmerman, J., Toubia, O., and Schwartz, H. A. (2015). The readability of privacy policies. Computers in Human Behavior, 52:479–487.
Cejas, O. A., Abualhaija, S., and Briand, L. C. (2024). Compai: A tool for gdpr completeness checking of privacy policies using artificial intelligence. In Proc. of the 39th IEEE/ACM International Conference on Automated Software Engineering, ASE ’24, page 2366–2369, New York, NY, USA. Association for Computing Machinery.
de Paula, R. F. O. (2022). Utilizando processamento de linguagem natural para avaliar políticas de privacidade. Trabalho de Graduação. Centro de Informática, UFPE.
Devlin, J., Chang, M. W., Lee, K., and Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (NAACL-HLT 2019).
Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and Tensor-Flow: Concepts, Tools, and Techniques to Build Intelligent Systems. O’Reilly Media, 2nd edition.
Herold, R. (2015). The Privacy Papers: Managing Technology, Consumer, Employee, and Legislative Actions. Auerbach Publications, 1st edition.
Khalid, H. and Mehmood, A. (2019). Sentiment analysis of product reviews using machine learning techniques. In 2019 2nd International Conference on Intelligent Sustainable Systems (ICISS), pages 324–327. IEEE.
Li, F., Li, Q., Yang, W., and Zhang, S. (2021). Automatic privacy policy analysis and its legal implications. IEEE Transactions on Information Forensics and Security, 16:1267–1278.
Manning, C. D. and Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press.
Peixoto, M., Ferreira, D., Cavalcanti, M., Silva, C., Vilela, J., Araújo, J., and Gorschek, T. (2023). The perspective of brazilian software developers on data privacy. Journal of Systems and Software, 195:111523.
Santana, E., Vilela, J., and Peixoto, M. (2022). Diretrizes para apresentação de políticas de privacidade voltadas à experiência do usuário. In WER 2022.
Singh, R. I., Sumeeth, M., and Miller, J. (2011). Evaluating the readability of privacy policies in mobile environments. Intl. Journal of Mobile HCI (IJMHCI), 3(1):55–78.
Sinha, A., Sharma, A., and Jha, S. (2018). Identifying ptsd symptoms using twitter data: A microblogging platform-based machine learning approach. In 2018 2nd Intl. Conference on Trends in Electronics and Informatics (ICOEI), pages 1097–1101. IEEE.
Solove, D. J. (2015). Understanding Privacy. Harvard University Press, 1st edition.
Terra, A., Vilela, J., and Peixoto, M. (2022). A catalog of quality criteria to guide the assessment of applications’ privacy policies. In WER 2022.
Zimmerman, J., Toubia, O., and Schwartz, H. A. (2015). The readability of privacy policies. Computers in Human Behavior, 52:479–487.
Publicado
19/05/2025
Como Citar
FERRAZ, Gabriel Cortizo; VILELA, Jéssyka; SILVA, Carla.
Uma Abordagem de Aprendizado de Máquina para Avaliar Políticas de Privacidade em um Contexto de Desenvolvimento de Sistemas de Informação com Privacidade por design. In: TRILHA DE TEMAS, IDEIAS E RESULTADOS EMERGENTES EM SISTEMAS DE INFORMAÇÃO - SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 21. , 2025, Recife/PE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 401-407.
DOI: https://doi.org/10.5753/sbsi_estendido.2025.246878.
