Engenharia de Software Inteligente para a Predição de Notícias Falsas: Representações de Codificador Bidirecional de Transformadores

  • Lara S. Moreira UNIPAMPA
  • Matheus de O. Ribeiro UNIPAMPA
  • Vitor X. Siqueira UNIPAMPA
  • Magino A. Correa UNIPAMPA
  • Cassio C. Junior UNIPAMPA
  • Eduardo A. Oliveira UNIPAMPA
  • João P. Merlugo UNIPAMPA
  • Fábio P. Basso UNIPAMPA
  • Williamson Silva UNIPAMPA
  • Gabriel M. Lunardi UNIPAMPA

Resumo


No mundo digital e cada vez mais orientado a dados, notícias falsas espalham-se rapidamente causando efeitos danosos. Nesse contexto, a Engenharia de Software Inteligente surge como meio para a construção de aplicações inteligentes orientadas a dados. Todavia, são escassos os esforços no idioma Português, especialmente os relacionados à experimentação de estratégias recentes, como a Representação de Codificador Bidirecional de Transformadores (BERT). Portanto, este trabalho avalia a capacidade do BERT, quando comparado com algoritmos tradicionais na detecção de notícias falsas baseada em classificação de textos.

Referências

Laura D. De Almeida, Victor Fuzaro, Falmer V. Nieto, and André Luiz Maciel Santana. Identificação de “fake news” no contexto político brasileiro: uma abordagem computacional. Anais do II Workshop sobre as Implicações da Computação na Sociedade (WICS 2021), 2021.

Vinícius Nunes Barbosa, Francisco Mendes Mendes Neto, Sebastiao Alves Filho, and Lenardo Silva. A comparative study of machine learning algorithms for the detection of fake news on the internet. In XVIII Brazilian Symposium on Information Systems, SBSI, page 8, 2022. ISBN 9781450396981.

Daniel Berrar. Cross-validation. In Encyclopedia of Bioinformatics and Computational Biology - Volume 1, pages 542–545. 2019. doi: 10.1016/b978-0-12-809633-8.20349-x.

José Canete, Gabriel Chaperon, Rodrigo Fuentes, Jou-Hui Ho, Hojin Kang, and Jorge Pérez. Spanish pre-trained bert model and evaluation data. Pml4dc at iclr, 2020:1–10, 2020.

Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. Bert: Pre-training of deep bidirectional transformers for language understanding, 2018. URL https://arxiv.org/abs/1810.04805.

K. Faceli. Inteligência artificial: uma abordagem de aprendizado de máquina. Grupo Gen - LTC, 2018. ISBN 9788521618805.

Paula Falcão, Aline Batista de Souza, et al. Pandemia de desinformação: as fake news no contexto da covid-19 no brasil. 2021.

Gartner. Gartner forecasts worldwide artificial intelligence software market to reach $62 billion in 2022. [link], 2021. (Accessed on 08/19/2022).

Kristian Kersting, Miryung Kim, Guy Van den Broeck, and Thomas Zimmermann. Se4ml-software engineering for ai-ml-based systems (dagstuhl seminar 20091). In Dagstuhl Reports, volume 10. Schloss Dagstuhl-Leibniz-Zentrum für Informatik, 2020.

Gabriel Machado Lunardi, Guilherme Medeiros Machado, Fadi Al Machot, Vinícius Maran, Alencar Machado, Heinrich C Mayr, Vladimir A Shekhovtsov, and José Palazzo M de Oliveira. Probabilistic ontology reasoning in ambient assistance: predicting human actions. In 32nd International Conference on Advanced Information Networking and Applications (AINA), pages 593–600. IEEE, 2018.

C. Manning and H. Schutze. Foundations of Statistical Natural Language Processing.

MIT Press, 1999. ISBN 9780262303798. URL https://books.google.com.br/books?id=3qnuDwAAQBAJ.

Louis Martin, Benjamin Muller, Pedro Javier Ortiz Suárez, Yoann Dupont, Laurent Romary, Éric de la Clergerie, Djamé Seddah, and Benoît Sagot. CamemBERT: a tasty French language model. In 58th Annual Meeting of the Association for Computational Linguistics, pages 7203–7219, 2020.

Rafael A Monteiro, Roney LS Santos, Thiago AS Pardo, Tiago A de Almeida, Evandro ES Ruiz, and Oto A Vale. Contributions to the study of fake news in portuguese: New corpus and automatic detection results. In International Conference on Computational Processing of the Portuguese Language, pages 324–334. Springer, 2018.

Isabela Moraes. Notícias falsas e pós-verdade: o mundo das fake news e da (des)informação — politize! https://www.politize.com.br/noticias-falsas-pos-verdade/, 2017. (Accessed on 08/28/2022).

Arsénio Reis, Dennis Paulino, Hugo Paredes, Isabel Barroso, Maria João Monteiro, Vitor Rodrigues, and João Barroso. Using intelligent personal assistants to assist the elderlies an evaluation of amazon alexa, google assistant, microsoft cortana, and apple siri. In 2018 2nd International Conference on Technology and Innovation in Sports, Health and Wellbeing (TISHW), pages 1–5. IEEE, 2018.

Roney L. S. Santos, Rafael A. Monteiro, and Thiago Alexandre Salgueiro Pardo. The fake.br corpus-a corpus of fake news for brazilian portuguese. 2018.

Satoshi Sekine and Elisabete Ranchhod. Named entities: recognition, classification and use, volume 19. John Benjamins Publishing, 2009.

Alex Serban, Koen van der Blom, Holger Hoos, and Joost Visser. Adoption and effects of software engineering best practices in machine learning. In Proceedings of the 14th ACM / IEEE International Symposium on Empirical Software Engineering and Measurement (ESEM), ESEM ’20, 2020. ISBN 9781450375801.

Fábio Souza, Rodrigo Nogueira, and Roberto Lotufo. Bertimbau: Pretrained bert models for brazilian portuguese. In Ricardo Cerri and Ronaldo C. Prati, editors, Intelligent Systems, pages 403–417, Cham, 2020. Springer International Publishing. ISBN 978-3-030-61377-8.

Humberto Fernandes Villela, Fábio Corrêa, Jurema Suely de Araújo Nery Ribeiro, Air Rabelo, and Emerson Eustáquio Costa. Uma analise da acuracia obtida e datasets utilizados em algoritmos de identificação de fake news. In ISLA 2022 Proceedings. Lacais, 2022.

Claes Wohlin, Per Runeson, Martin Höst, Magnus C Ohlsson, Björn Regnell, and Anders Wesslén. Experimentation in software engineering. Springer Science & Business Media, 2012.

Tao Xie. Intelligent software engineering: Synergy between ai and software engineering. In International symposium on dependable software engineering: Theories, tools, and applications, pages 3–7. Springer, 2018.
Publicado
18/10/2022
MOREIRA, Lara S. et al. Engenharia de Software Inteligente para a Predição de Notícias Falsas: Representações de Codificador Bidirecional de Transformadores. In: ESCOLA REGIONAL DE ENGENHARIA DE SOFTWARE (ERES), 6. , 2022, Blumenau. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 61-70. DOI: https://doi.org/10.5753/eres.2022.227741.