A Twitter-based Data Warehouse for Portuguese Sentiment Analysis: 2018 Election Case Study

  • Jonathan Suter IFC
  • Rodrigo Nogueira IFC
  • Tatiana Tozzi IFC
  • Daniel Anderle IFC
  • Rafael Speroni IFC

Abstract


Social networks are increasingly impacting everyday people and organizations, in this context Twitter, in which a user writes an expression with up to 280 characters and other people can see or share that phrase again or their own. This paper presents a work that aims to consume the great data repository that is Twitter, and from it to create a Data Warehouse in which it is possible to analyze the texts, the expressions contained. In this proposal, methods of pre processing texts are included. Also to enrich this base with the analysis of feeling, in addition to the project of the database the proposal includes a classifier method for the texts, using machine learning, that is able to predict a feeling related to a Tweet, be it positive, neutral or negative.

Keywords: Data Warehouse, Social Networks, Twitter, Machine Learning

References

AGUIAR, Erickson et. al. Análise de Sentimento em Redes Sociais para a Língua Portuguesa Utilizando Algoritmos de Classificação. 2018.

ANDRADE, Carina et. al. O Twitter como Agente Facilitador de Recolha e Interpretação de Sentimentos: Exemplo na Escolha da Palavra do Ano. In: 15ª Conferência da Associação Portuguesa de Sistemas de Informação. 2015.

ARAÚJO, Mateus et. al. Métodos para análise de sentimentos no Twitter. In:Universidade Federal de Minas Gerais. 2016.

CAMILO, Cássio et al. Mineração de dados: conceitos, tarefas, métodos e ferramentas. In: Instituto de Informática. Universidade Federal de Goiás. 2009. p 12-15.

CAVALCANTE, Paulo Emílio Costa. Um dataset para análise de sentimentos na língua portuguesa. 2017.

CORRÊA, Igor. Análise de sentimentos expressos na rede social Twitter em relação aos filmes indicados ao Oscar 2017. In: Universidade Federal de Uberlândia. 2017.

JUNIOR, V. F., WOSZEZENKI, C., ANDERLE, D. F., SPERONI, R., NAKAYAMA, M. K. (2014). A pesquisa científica e tecnológica. Espacios, 35(9).

JUNQUEIRA, Kássio TC; DA ROCHA FERNANDES, Anita Maria. Análise de Sentimento em Redes Sociais no Idioma Português com Base em Mensagens do Twitter. Anais do Computer on the Beach, p. 681-690, 2018.

KIMBALL, Ralph; ROSS, Margy. The data warehouse toolkit: the complete guide to dimensional modeling. John Wiley & Sons, 2011.

MANSMANN, Svetlana. Building a Data Warehouse for Twitter Stream Exploration.In: University of Konstanz, Germany. 2012.

MORAES, Silvia et. al. 7x1•PT: um Corpus extraído do Twitter para Análise de Sentimentos em Língua Portuguesa. 2015.

NASCIMENTO, Paula et. al. Análise de sentimento de tweets com foco em notícias. 2012.

NOGUEIRA, Rodrigo R. Newsminer: um sistema de datawarehouse baseado em texto de notícias.In: Universidade Federal de São Carlos. 2017

PIZZANI, Luciana et. al. A arte da pesquisa bibliográfica na busca do conhecimento. In: Revista Digital de Biblioteconomia e Ciência da Informação. TAVARES, Jonatas et al. Soluções de BI 2.0 para Análise de Dados a partir do Twitter®: Eleições 2014.2017.

TREVISAN, Allan. MINERAÇÃO DE TEXTOS NO TWITTER .2015
Published
2019-04-10
SUTER, Jonathan; NOGUEIRA, Rodrigo; TOZZI, Tatiana; ANDERLE, Daniel; SPERONI, Rafael. A Twitter-based Data Warehouse for Portuguese Sentiment Analysis: 2018 Election Case Study. In: REGIONAL DATABASE SCHOOL (ERBD), 15. , 2019, Chapecó. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 41-50. ISSN 2595-413X. DOI: https://doi.org/10.5753/erbd.2019.8477.