Avaliação da versão em português do LIWC Lexicon 2015 com análise de sentimentos em redes sociais

  • Flavio Carvalho CEFET-RJ
  • Rafael Guimarães Rodrigues CEFET-RJ
  • Gabriel Santos CEFET-RJ
  • Pedro Cruz CEFET-RJ
  • Lilian Ferrari UFRJ
  • Gustavo Paiva Guedes CEFET-RJ


O LIWC é um programa de análise de texto que categoriza palavras em categorias derivadas de gramática e psicologia. O léxico LIWC atualmente disponível para o português brasileiro (LIWC 2007pt) é baseado na versão 2007 do programa LIWC. Como vários estudos indicaram, o LIWC 2007pt mostra problemas de desempenho e categorização. Neste cenário, este trabalho destaca um novo léxico do LIWC no Brasil (LIWC 2015pt), baseado no programa LIWC 2015. Este trabalho compara o desempenho do LIWC 2007pt e do LIWC 2015pt em tarefas de classificação. Três experimentos foram conduzidos e os resultados indicam que o LIWC 2015pt supera o LIWC 2007pt em todas as três tarefas.

Palavras-chave: Processamento de Linguagem Natural, Detecção de Emoções, Linguistic Inquiry and Word Count (LIWC)


