Detecção de Mensagens Homofóbicas em Português no Twitter usando Análise de Sentimentos

Vinicius Matheus de Medeiros Silva Coutinho; Yuri Malheiros

doi:10.5753/brasnam.2020.11158

Vinicius Matheus de Medeiros Silva Coutinho UFPB
Yuri Malheiros UFPB

DOI: https://doi.org/10.5753/brasnam.2020.11158

Resumo

Discurso de ódio em redes sociais direcionado a minorias trazem hostilidade para este meio causando sofrimento e danos que vão além do mundo digital. Moderadores podem ajudar no controle de mensagens ofensivas, mas com o grande volume de mensagens publicadas é inviável realizar uma filtragem manual. Para tentar combater a propagação de mensagens de ódio de forma mais abrangente, este trabalho tem como objetivo utilizar análise de sentimentos para detecção de mensagens homofóbicas em português no Twitter. Os resultados da técnica desenvolvida foram comparados com as interpretações de humanos. Neste experimento, a técnica obteve 0,6148 de acurácia, 0,6667 de precisão, 0,6216 de sensibilidade e 0,6433 de f-measure.

Palavras-chave: análise de sentimentos, discurso de ódio, redes sociais, aprendizagem de máquina

Referências

Andrade, M. and Pischetola, M. (2016). O discurso de ódio nas mídias sociais: a diferença como letramento midiático e informacional na aprendizagem. Revista e Curriculum, 14(4):1377–1394.

Burnap, P. and Williams, M. L. (2016). Us and them: identifying cyber hate on twitter across multiple protected characteristics. EPJ Data science, 5(1):11.

Cohen-Almagor, R. (2011). Fighting hate and bigotry on the internet. Policy & Internet, 3(3):1–26.

Davidson, T., Warmsley, D., Macy, M., and Weber, I. (2017). Automated hate speech detection and the problem of offensive language. In Eleventh international aaai conference on web and social media.

de Pelle, R. P. and Moreira, V. P. (2017). Offensive comments in the brazilian web: a dataset and baseline results. In Anais do VI Brazilian Workshop on Social Network Analysis and Mining. SBC.

Fleiss, J. L. (1971). Measuring nominal scale agreement among many raters. Psychological bulletin, 76(5):378.

Fortuna, P. C. T. (2017). Automatic detection of hate speech in text: an overview of the topic and dataset annotation with hierarchical classes.

Gitari, N. D., Zuping, Z., Damien, H., and Long, J. (2015). A lexicon-based approach for hate speech detection. International Journal of Multimedia and Ubiquitous Engineering, 10(4):215–230.

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel,M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau,D., Brucher, M., Perrot, M., and Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12:2825–2830.

Penni, J. (2017). The future of online social networks (osn): A measurement analysis using social media tools and application. Telematics and Informatics, 34(5):498–517.

Silva, E. P., Malheiros, Y., Nunes, R. T. A., Antunes, I. L., and Rêgo, T. G. (2019). Um conjunto de dados extraído do twitter para análise de sentimentos na língua portuguesa. In Proceedings of XII Symposium in Information and Human Language Technology, pages 53–60.

Silva, S. and Serapião, A. (2018). Detecção de discurso de ódio em português usando cnn combinada a vetores de palavras. In Proceedings of KDMILE 2018, Symposium on Knowledge Discovery, Mining and Learning, São Paulo, SP, Brazil.