BOU-Guard: Uma Abordagem para Detecção de Conteúdo Impróprio na Internet
Resumo
Em meio ao cenário digital em constante expansão, a exposição a conteúdo impróprio, como racismo, homofobia e sexismo, tornou-se uma preocupação cada vez mais premente. Apesar da literatura existente sobre discurso de ódio online, persistem limitações significativas, incluindo a falta de automação e mecanismos de alerta eficazes. Este artigo propõe uma abordagem inovadora, apresentando o BOU-Guard (Behavior Observation Unit - Guard), baseado na tecnologia GPT-3.5-Turbo, para detectar e filtrar conteúdos preconceituosos ou ofensivos. Por meio de uma prova de conceito, demonstrou-se que a aplicação do mecanismo proposto na análise de 30 páginas web é capaz de detectar conteúdos ofensivos com alta F1-Score média para conteúdos relacionados a homofobia (94,69%), racismo (98,45%) e machismo (98,09%).
Referências
Chiu, K.-L., Collins, A., and Alexander, R. (2021). Detecting hate speech with gpt-3. arXiv preprint arXiv:2103.12407.
Gámez-Guadix, M. and Incera, D. (2021). Homophobia is online: Sexual victimization and risks on the internet and mental health among bisexual, homosexual, pansexual, asexual, and queer adolescents. Computers in human behavior, 119:106728.
Martins, M. V., Formiga, A., Santos, C., Sousa, D., Resende, C., Campos, R., Nogueira, N., Carvalho, P., and Ferreira, S. (2020). Adolescent internet addiction–role of parental control and adolescent behaviours. International Journal of Pediatrics and Adolescent Medicine, 7(3):116–120.
Sheth, A., Shalin, V. L., and Kursuncu, U. (2022). Defining and detecting toxicity on social media: context and knowledge are key. Neurocomputing, 490:312–318.
Wang, H., Hee, M. S., Awal, M. R., Choo, K. T. W., and Lee, R. K.-W. (2023). Evaluating gpt-3 generated explanations for hateful content moderation. arXiv preprint arXiv:2305.17680.
Yenala, H., Jhanwar, A., Chinnakotla, M. K., and Goyal, J. (2018). Deep learning for detecting inappropriate content in text. International Journal of Data Science and Analytics, 6:273–286.