O Discurso de Ódio Homofóbico no Twitter a partir da Análise de Dados

  • Vinícius S. dos Santos CEFET-RJ
  • Felipe da R. Henriques CEFET-RJ
  • Gustavo Guedes CEFET-RJ

Resumo


O objetivo deste estudo é analisar mensagens do Twitter com conteúdo homofóbico. Inicialmente, nós investigamos e sumarizamos os termos contidos nos textos utilizando técnicas de mineração textual, por meio do Bag of Words (BoW). Após as análises exploratórias iniciais, utilizamos técnicas de agrupamento nos termos extraídos, permitindo avaliar as diferenças entre os elementos textuais nos grupos resultantes. Por fim, este estudo utiliza técnicas de mineração de texto, análise de agrupamentos e visualização de dados aplicados a um tema atual da sociedade, permitindo a descoberta de informações contidas nos textos extraídos e explicando casos de homofobia no twitter.

Palavras-chave: Mineração de Texto, Análise de Dados, Análise de Agrupamento

Referências

Brasil (2019). Direito Constitucional - Ação Direta de Inconstitucionalidade por omissão. Supremo Tribunal Federal. [link]. Acessado em 14 de setembro de 2020.

Burnap, P. and Williams, M. L. (2015). Cyber hate speech on twitter: An application of machine classification and statistical modeling for policy and decision making. Policy & Internet, 7(2):223–242. Acessado em 21 de setembro de 2020.

Han, J., Kamber, M., and Pei, J. (2012). Data mining concepts and techniques, third edition.

Hatebase, I. (2020). How it works? https://hatebase.org/how_it_works. Acessado em 13 de setembro 2020.

Honey, C. and Herring, S. (2009). Beyond microblogging: Conversation and collaboration via twitter. pages 1 – 10. Acessado em 21 de setembro de 2020.

MacAvaney, S., Yao, H.-R., Yang, E., Russell, K., Goharian, N., and Frieder, O. (2019).

Hate speech detection: Challenges and solutions. PLOS ONE, 14(8):1–16. https://doi.org/10.1371/journal.pone.0221152. Acessado em: 2020-09-21.

Marutho, D., Hendra Handaka, S., Wijaya, E., and Muljono (2018). The determination of cluster number at k-mean using elbow method and purity evaluation on headline news. In 2018 International Seminar on Application for Technology of Information and Communication, pages 533–538.

Nascimento, R., Santos, G., Carvalho, F., and Guedes, G. (2021). Avaliando contribuições na substituição de termos informais em classificação de texto de redes sociais com netspeak-br. In Anais do X Brazilian Workshop on Social Network Analysis and Mining, pages 181–186, Porto Alegre, RS, Brasil. SBC.

Nascimento, R., Santos, L., and Guedes, G. (2019). Netspeak-br: Um léxico sobre expressões criadas na língua portuguesa brasileira para a internet. In Anais do Symposium in Information and Human Language Technology, pages 71–75, Online Event, Brazil. SBC.

Nassif, L. F. (2011). Técnicas de Agrupamento de Texto aplicadas à computação forense. Acessado em 13 de setembro de 2021.

Santana, R. (2020). Como preparar Dados de Texto para Machine Learning. [link]. Acessado em 13 de setembro de 2021.

Silva, A. and Roman, N. (2020). Hate speech detection in portuguese with naïve bayes, svm, mlp and logistic regression. In Anais do XVII Encontro Nacional de Inteligência Artificial e Computacional, pages 1–12, Porto Alegre, RS, Brasil. SBC.

Silva Neto, S. R. d. (2017). Uma abordagem computacional para identificação de indício de preconceito em textos baseada em análise de sentimentos. In Proposta de Dissertação Curso de Pós-Graduação em Informática da UFAL, Maceió, AL, Brasil. Acessado em 21 de setembro de 2020.

S.PAULO, O. E. D. (2017). Youtuber contratado pelo governo fez posts racistas e homofóbicos no Twitter. [link]. Acessado em 16 de setembro de 2020.

Twitter, I. (2020). Perguntas frequentes de novos usuários. https://help.twitter.com/pt/new-user-faq. Acessado em 13 de setembro de 2021.

UOL (2010). Grupo gay condena perfil homofóbico que já tem 15 mil adeptos no Twitter. [link]. Acessado em 16 de setembro de 2020.

UOL (2020). Entenda o que significa cada uma das letras desta bandeira de luta. https://www.uol.com.br/universa/amp-stories/lgbtqi-entenda-as-letras. Acessado em 13 de setembro de 2021.

Van Rossum, G. and Drake, F. L. (2009). Python 3 Reference Manual. CreateSpace, Scotts Valley, CA.
Publicado
31/07/2022
SANTOS, Vinícius S. dos; HENRIQUES, Felipe da R.; GUEDES, Gustavo. O Discurso de Ódio Homofóbico no Twitter a partir da Análise de Dados. In: BRAZILIAN WORKSHOP ON SOCIAL NETWORK ANALYSIS AND MINING (BRASNAM), 11. , 2022, Niterói. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 109-120. ISSN 2595-6094. DOI: https://doi.org/10.5753/brasnam.2022.222916.