Avaliação de Desempenho Das Etapas do Processo de Extração de Conhecimento para Detecção de Fake News em Português

  • Alice Barbosa IFCE
  • Felipe Sousa IFCE
  • Reinaldo Braga IFCE

Resumo


Devido ao aumento significativo de fake news nas redes sociais, diversos estudos e estratégias têm sido desenvolvidos nos últimos anos com o intuito de identificá-las. Sendo assim, o presente artigo apresenta uma proposta para identificação automática de fake news. Mais especificamente, é realizada uma análise do processo de construção dos algoritmos, investigando o impacto das tomadas de decisão no processo metodológico no resultado final. Para este fim, foi utilizada a base de dados Fake.Br, que apresenta 7.200 artigos de notícias em português. Destaca-se que a pesquisa realizada concentrou-se em analisar tanto os textos quanto os seus respectivos metadados. Desta forma, após uma análise das combinações, obteve-se uma média da acurácia de 97%.

Palavras-chave: Fake News, Machine Learning, Processamento de Linguagem Natural

Referências

Allcott, H. and Gentzkow, M. (2017). Social Media and Fake News in the 2016 Election. Journal of Economic Perspectives, 31:211–236.

Almeida, L., Fuzaro, V., Nieto, F. V., and Santana, A. (2021). Identificação de “Fake News” no Contexto Político Brasileiro: Uma Abordagem Computacional. In Anais do II Workshop sobre as Implicações da Computação na Sociedade, pages 78–89, Porto Alegre, RS, Brasil. SBC.

Aro, J. (2016). The Cyberspace War: Propaganda and Trolling as Warfare Tools. European View, 15(1):121–132.

Carvalho, C., Klagge, N., and Moench, E. (2011). The Persistent Effects of a False News Shock. Journal of Empirical Finance, 18(4):597–615.

DataReportal (2022). Digital 2023: Global Overview Report. Disponível em: [link]. Acesso em: 02 Maio 2023.

de Souza, M. P., da Silva, F. R. M., Freire, P. M. S., and Goldschmidt, R. R. (2020). A Linguistic-Based Method that Combines Polarity, Emotion, and Grammatical Characteristics to Detect Fake News in Portuguese. Brazilian Symposium on Multimedia and the Web.

Fuller, C. M., Biros, D. P., and Wilson, R. L. (2009). Decision Support for Determining Veracity via Linguistic-Based Cues. Decision Support Systems, 46(3):695–703. Wireless in the Healthcare.

Gonzalez, M. and Lima, V. L. S. d. (2003). Recuperação de Informação e Processamento da Linguagem Natural. XXIII Congresso da Sociedade Brasileira de Computação.

Kogan, S., Moskowitz, T. J., and Niessner, M. (2019). Fake News: Evidence from Financial Markets. Available at SSRN, 3237763.

Kumar, S., Kumar, S., Yadav, P., and Bagri, M. (2021). A Survey on Analysis of Fake News Detection Techniques.

Monteiro, R. A., Santos, R. L. S., Pardo, T. A. S., de Almeida, T. A., Ruiz, E. E. S., and Vale, O. A. (2018). Contributions to the Study of Fake News in Portuguese: New Corpus and Automatic Detection Results. In Computational Processing of the Portuguese Language, pages 324–334. Springer International Publishing.

Reuters, I. and of Oxford, U. (2021). Reuters Institute Digital News Report 2021. Disponível em: [link]. Acesso em: 18 Maio 2022.

Rosa, M. d. A., Amorim, H. C., Gomes, R. M., and Santos, B. A. (2019). Detecção de Fake News: Uma Abordagem Utilizando Redes Neurais Convolucionais.

Sharma, K., Qian, F., Jiang, H., Ruchansky, N., Zhang, M., and Liu, Y. (2019). Combating Fake News: A Survey on Identification and Mitigation Techniques. ACM Trans. Intell. Syst. Technol., 10(3).

Sousa, F., Barbosa, A., Oliveira, C., and Braga, R. (2022). Detecção de Fake News em Língua Portuguesa Combinando Redes Neurais Convolucionais e Algoritmos de Aprendizagem de Máquina. Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos.
Publicado
19/10/2023
BARBOSA, Alice; SOUSA, Felipe; BRAGA, Reinaldo. Avaliação de Desempenho Das Etapas do Processo de Extração de Conhecimento para Detecção de Fake News em Português. In: ENCONTRO UNIFICADO DE COMPUTAÇÃO DO PIAUÍ (ENUCOMPI), 16. , 2023, Piripiri/PI. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 89-96. DOI: https://doi.org/10.5753/enucompi.2023.26621.