BOU-Guard: Uma Abordagem para Detecção de Conteúdo Impróprio na Internet

Guilherme Bou; Adriano M. Rocha; Vagner E. Quincozes; Silvio E. Quincozes; Juliano F. Kazienko

doi:10.5753/sbseg_estendido.2023.235046

Guilherme Bou UFU
Adriano M. Rocha UFU
Vagner E. Quincozes UFF
Silvio E. Quincozes UFU / UNIPAMPA
Juliano F. Kazienko UFSM

DOI: https://doi.org/10.5753/sbseg_estendido.2023.235046

Resumo

Em meio ao cenário digital em constante expansão, a exposição a conteúdo impróprio, como racismo, homofobia e sexismo, tornou-se uma preocupação cada vez mais premente. Apesar da literatura existente sobre discurso de ódio online, persistem limitações significativas, incluindo a falta de automação e mecanismos de alerta eficazes. Este artigo propõe uma abordagem inovadora, apresentando o BOU-Guard (Behavior Observation Unit - Guard), baseado na tecnologia GPT-3.5-Turbo, para detectar e filtrar conteúdos preconceituosos ou ofensivos. Por meio de uma prova de conceito, demonstrou-se que a aplicação do mecanismo proposto na análise de 30 páginas web é capaz de detectar conteúdos ofensivos com alta F1-Score média para conteúdos relacionados a homofobia (94,69%), racismo (98,45%) e machismo (98,09%).

Referências

Bliuc, A.-M., Faulkner, N., Jakubowicz, A., and McGarty, C. (2018). Online networks of racial hate: A systematic review of 10 years of research on cyber-racism. Computers in Human Behavior, 87:75–86.

Chiu, K.-L., Collins, A., and Alexander, R. (2021). Detecting hate speech with gpt-3. arXiv preprint arXiv:2103.12407.

Gámez-Guadix, M. and Incera, D. (2021). Homophobia is online: Sexual victimization and risks on the internet and mental health among bisexual, homosexual, pansexual, asexual, and queer adolescents. Computers in human behavior, 119:106728.

Martins, M. V., Formiga, A., Santos, C., Sousa, D., Resende, C., Campos, R., Nogueira, N., Carvalho, P., and Ferreira, S. (2020). Adolescent internet addiction–role of parental control and adolescent behaviours. International Journal of Pediatrics and Adolescent Medicine, 7(3):116–120.

Sheth, A., Shalin, V. L., and Kursuncu, U. (2022). Defining and detecting toxicity on social media: context and knowledge are key. Neurocomputing, 490:312–318.

Wang, H., Hee, M. S., Awal, M. R., Choo, K. T. W., and Lee, R. K.-W. (2023). Evaluating gpt-3 generated explanations for hateful content moderation. arXiv preprint arXiv:2305.17680.

Yenala, H., Jhanwar, A., Chinnakotla, M. K., and Goyal, J. (2018). Deep learning for detecting inappropriate content in text. International Journal of Data Science and Analytics, 6:273–286.

BOU-Guard: Uma Abordagem para Detecção de Conteúdo Impróprio na Internet

Resumo

Referências

Artigos mais lidos do(s) mesmo(s) autor(es)