7x1­-PT: um Corpus extraído do Twitter para Análise de Sentimentos em Língua Portuguesa

  • Silvia M. W. Moraes PUCRS
  • Isabel H. Manssour PUCRS
  • Milene S. Silveira PUCRS

Resumo


Este artigo descreve o corpus 7x1-­PT que contém um conjunto de tweets, em português, postados ao longo da partida da Alemanha com o Brasil durante a Copa do Mundo de 2014 da FIFA. Nós descrevemos como foi realizada a coleta, a limpeza e a organização, bem como comentamos o estágio atual  de anotação linguística desse corpus.

Publicado
04/11/2015
MORAES, Silvia M. W.; MANSSOUR, Isabel H.; SILVEIRA, Milene S.. 7x1­-PT: um Corpus extraído do Twitter para Análise de Sentimentos em Língua Portuguesa. In: SIMPÓSIO BRASILEIRO DE TECNOLOGIA DA INFORMAÇÃO E DA LINGUAGEM HUMANA (STIL), 1. , 2015, Natal/RN. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2015 . p. 21-25.