Detecção automática de discurso de ódio em comentários online

Peter Dias Paiva; Vanecy Matias da Silva; Raimundo Santos Moura

Peter Dias Paiva UFPI
Vanecy Matias da Silva UFPI
Raimundo Santos Moura UFPI

Resumo

Combater discurso de ódio na Internet tem se tornado um grande desafio. Neste sentido, propõe-se uma solução para detectar comentários ofensivos que buscam disseminar ódio na rede. A proposta usa um Bag of Words, aplicado a uma base de comentários em português retirados de um site de notícias. Os resultados mostram a viabilidade da proposta e que ela pode ser utilizada como base para o desenvolvimento de novas aplicações.

Referências

Culotta, A., and Sorensen, J. (2004). Dependency tree kernels for relation extraction. In Proc. of the 42nd annual meeting on association for computational linguistics (ACL).

Fortuna, P. (2017). Automatic detection of hate speech in text: an overview of the topic and dataset annotation with hierarchical classes. Master’s thesis, Faculdade de Engenharia da Universidade do Porto.

Henke, M., Santos, C., Nunan, E., Feitosa, E., dos Santos, E., & Souto, E. (2011). Aprendizagem de máquina para segurança em redes de computadores: Métodos e aplicações. In Livro dos Minicursos do XI Simpósio Brasileiro em Segurança da Informação e de Sistemas Computacionais (SBC, ed.).

Kwok, I., and Wang, Y. (2013). Locate the hate: Detecting tweets against blacks. In Twenty-seventh AAAI conference on artificial intelligence.

Mondal, M., Silva, L. A., and Benevenuto, F. (2017). A measurement study of hate speech in social media. In Proc. of the 28th ACM Conference on Hypertext and Social Media.

Nockleby, J. (2000). Hate speech. Encyclopedia of the American constitution, 3(2).

Pelle, R., and Moreira, V. (2017). Offensive Comments in the Brazilian Web: a dataset and baselines results. In Proc. of the 6th Brazilian Workshop on Social Network Analysis and Mining (BraSNAM).

Ranzi, C. (2017) “lista-palavroes-bloqueio.txt”. Disponível em: https://pt.scribd.com/document/345921799/lista-palavroes-bloqueio-txt.

UOL Notícias (2019) “De Xuxa a Madonna: Famosas sofrem ataques de ódio por envelhecerem”, Disponível em: https://noticiasdatv.uol.com.br/noticia/celebridades/de-xuxa-madonna-artistas-sofrem-ataques-de-odio-por-envelhecerem-26946.

LibreOffice (2013) “VERO”. Disponível em: https://pt-br.libreoffice.org/projetos/vero/.

Xiang, G., Fan, B., Wang, L., Hong, J., & Rose, C. (2012). Detecting offensive tweets via topical feature discovery over a large scale twitter corpus. In Proc. of the 21st ACM international conference on Information and knowledge management.