Anotando um Corpus de Notícias para a Análise de Sentimento: um Relato de Experiência

  • Mariza Miola Dosciatti PUCPR
  • Lohann Paterno Coutinho Ferreira PUCPR
  • Emerson Cabrera Paraiso PUCPR

Resumo


Este artigo relata o processo de construção e anotação de um corpus de notícias para a Análise de Sentimento. Os textos, extraídos de jornais do Brasil, foram anotados com as emoções básicas (alegria, tristeza, raiva, surpresa, repugnância e medo) ou a ausência de emoção (neutro). O processo de anotação resultou em valor de concordância baixo (kappa = 0,38). Apresentamos o processo de anotação e os resultados de alguns experimentos realizados durante e após a anotação, com o objetivo de entender os motivos da baixa concordância. O corpus anotado foi submetido a um método de identificação de emoções, sendo os resultados obtidos também apresentados.

Publicado
04/11/2015
DOSCIATTI, Mariza Miola; FERREIRA, Lohann Paterno Coutinho; PARAISO, Emerson Cabrera. Anotando um Corpus de Notícias para a Análise de Sentimento: um Relato de Experiência. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 1. , 2015, Natal/RN. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2015 . p. 121-130.