Implementação e Validação de um Sistema Protótipo para a Detecção de Discurso de Ódio Usando Inteligência Artificial
Resumo
Este estudo propõe um sistema protótipo usando o modelo BERTimbau para detectar discurso de ódio em conversas de chat, especificamente adaptado as características linguísticas e contextuais do português brasileiro. Dessa forma, é analisado como os sistemas de moderação automatizados podem ser integrados em ambientes digitais para aprimorar interações sociais. Um sistema protótipo foi desenvolvido e avaliado usando uma abordagem quantitativa descritiva, alcançando métricas de desempenho satisfatórias na identificação de linguagem ofensiva e demonstrando tempos de resposta eficientes. O estudo destaca o potencial de modelos NLP para melhorar a moderação de conteúdo em português, oferecendo resultados adequados para a academia e o setor privado quer permitam fortalecer estratégias de segurança digital.Referências
Chaves Rodrigues, R., Tanti, M., and Agerri, R. (2023). Evaluation of Portuguese Language Models.
Jurafsky, D. and Martin, J. H. (2008). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall, 2 edition.
Llansó, E., Hoboken, J., Leerssen, P., and Harambam, J. (2020). Artificial intelligence, content moderation, and freedom of expression. Institute for Information Law. [link].
Nobata, C., Tetreault, J., Thet, T., and Choi, Y. (2016). Abusive language detection in online user content. In Proceedings of the 25th International Conference on World Wide Web, pages 145–153. International World Wide Web Conferences Steering Committee.
Ribeiro, M. H., Santos, C. R., and Silva, A. L. (2023). Moderating hate speech in online platforms: Approaches and challenges. Journal of Digital Communication, 15(2):123–139.
Schmidt, A. and Wiegand, M. (2017). A survey on hate speech detection using natural language processing. In Proceedings of the Fifth International Workshop on Natural Language Processing for Social Media, pages 1–10.
Souza, F., Nogueira, R., and Lotufo, R. (2019). Portuguese named entity recognition using bert-crf. arXiv preprint arXiv:1909.10649.
Souza, F., Nogueira, R., and Lotufo, R. (2020). Bertimbau: Pretrained bert models for brazilian portuguese. In Cerri, R. and Prati, R. C., editors, Intelligent Systems, pages 403–417, Cham. Springer International Publishing.
Souza, M., Oliveira, F., and Gomes, R. (2022). Aplicação de bertimbau para detecção de discurso de Ódio em redes sociais. Revista Brasileira de Inteligência Artificial, 23(3):45–62.
Taborda, L. E., de Melo, M. H. C., Luiz, D. E. C., and de Resende Miranda, J. I. (2024). Lei geral de proteção de dados como instrumento de políticas públicas. OBSERVATÓRIO DE LA ECONOMÍA LATINOAMERICANA, 22(5):e4908–e4908.
Tanenbaum, A. S. and Wetherall, D. J. (2010). Computer Networks. Prentice Hall, 5th edition.
Tufekci, Z. (2018). Twitter and Tear Gas: The Power and Fragility of Networked Protest. Yale University Press.
Vargas, F., Carvalho, I., Rodrigues de Góes, F., Pardo, T., and Benevenuto, F. (2022). HateBR: A large expert annotated corpus of Brazilian Instagram comments for offensive language and hate speech detection. In Proceedings of the Thirteenth Language Resources and Evaluation Conference, pages 7174–7183, Marseille, France. European Language Resources Association.
Vaswani, A. (2017). Attention is all you need. Advances in Neural Information Processing Systems.
Jurafsky, D. and Martin, J. H. (2008). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall, 2 edition.
Llansó, E., Hoboken, J., Leerssen, P., and Harambam, J. (2020). Artificial intelligence, content moderation, and freedom of expression. Institute for Information Law. [link].
Nobata, C., Tetreault, J., Thet, T., and Choi, Y. (2016). Abusive language detection in online user content. In Proceedings of the 25th International Conference on World Wide Web, pages 145–153. International World Wide Web Conferences Steering Committee.
Ribeiro, M. H., Santos, C. R., and Silva, A. L. (2023). Moderating hate speech in online platforms: Approaches and challenges. Journal of Digital Communication, 15(2):123–139.
Schmidt, A. and Wiegand, M. (2017). A survey on hate speech detection using natural language processing. In Proceedings of the Fifth International Workshop on Natural Language Processing for Social Media, pages 1–10.
Souza, F., Nogueira, R., and Lotufo, R. (2019). Portuguese named entity recognition using bert-crf. arXiv preprint arXiv:1909.10649.
Souza, F., Nogueira, R., and Lotufo, R. (2020). Bertimbau: Pretrained bert models for brazilian portuguese. In Cerri, R. and Prati, R. C., editors, Intelligent Systems, pages 403–417, Cham. Springer International Publishing.
Souza, M., Oliveira, F., and Gomes, R. (2022). Aplicação de bertimbau para detecção de discurso de Ódio em redes sociais. Revista Brasileira de Inteligência Artificial, 23(3):45–62.
Taborda, L. E., de Melo, M. H. C., Luiz, D. E. C., and de Resende Miranda, J. I. (2024). Lei geral de proteção de dados como instrumento de políticas públicas. OBSERVATÓRIO DE LA ECONOMÍA LATINOAMERICANA, 22(5):e4908–e4908.
Tanenbaum, A. S. and Wetherall, D. J. (2010). Computer Networks. Prentice Hall, 5th edition.
Tufekci, Z. (2018). Twitter and Tear Gas: The Power and Fragility of Networked Protest. Yale University Press.
Vargas, F., Carvalho, I., Rodrigues de Góes, F., Pardo, T., and Benevenuto, F. (2022). HateBR: A large expert annotated corpus of Brazilian Instagram comments for offensive language and hate speech detection. In Proceedings of the Thirteenth Language Resources and Evaluation Conference, pages 7174–7183, Marseille, France. European Language Resources Association.
Vaswani, A. (2017). Attention is all you need. Advances in Neural Information Processing Systems.
Publicado
19/05/2025
Como Citar
BARRETO, Gabriel; TOQUICA, Juan S..
Implementação e Validação de um Sistema Protótipo para a Detecção de Discurso de Ódio Usando Inteligência Artificial. In: TRILHA DE TEMAS, IDEIAS E RESULTADOS EMERGENTES EM SISTEMAS DE INFORMAÇÃO - SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 21. , 2025, Recife/PE.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 352-358.
DOI: https://doi.org/10.5753/sbsi_estendido.2025.246778.
