Um Data Warehouse Textual em Língua Portuguesa: Estudo de caso do sentimento dos usuários do Twitter durante a eleição de 2018

  • Jonathan Suter IFC
  • Rodrigo Nogueira IFC
  • Tatiana Tozzi IFC
  • Daniel Anderle IFC
  • Rafael Speroni IFC

Resumo


As redes sociais cada dia mais causam impacto no cotidiano das pessoas e organizações, neste contexto, o Twitter, no qual um usuário escreve uma expressão com até 280 caracteres e outras pessoas podem ver ou compartilhar novamente essa mesma expressão ou a sua própria. Este artigo apresenta um trabalho que tem como objetivo consumir o grande repositório de dados que é o Twitter, e, a partir dele criar um Data Warehouse no qual é possível analisar os textos, as expressões contidas. Nesta proposta, são incluídos métodos de pré-processamento dos textos. Também para enriquecer essa base com a análise de sentimento, além do projeto do banco de dados a proposta inclui um método classificador para os textos, utilizando aprendizado de máquina, que é capaz de predizer um sentimento relacionado a um Tweet, seja ele positivo, neutro ou negativo.

Palavras-chave: Data Warehouse, Redes Sociais, Twitter, Machine Learning

Referências

AGUIAR, Erickson et. al. Análise de Sentimento em Redes Sociais para a Língua Portuguesa Utilizando Algoritmos de Classificação. 2018.

ANDRADE, Carina et. al. O Twitter como Agente Facilitador de Recolha e Interpretação de Sentimentos: Exemplo na Escolha da Palavra do Ano. In: 15ª Conferência da Associação Portuguesa de Sistemas de Informação. 2015.

ARAÚJO, Mateus et. al. Métodos para análise de sentimentos no Twitter. In:Universidade Federal de Minas Gerais. 2016.

CAMILO, Cássio et al. Mineração de dados: conceitos, tarefas, métodos e ferramentas. In: Instituto de Informática. Universidade Federal de Goiás. 2009. p 12-15.

CAVALCANTE, Paulo Emílio Costa. Um dataset para análise de sentimentos na língua portuguesa. 2017.

CORRÊA, Igor. Análise de sentimentos expressos na rede social Twitter em relação aos filmes indicados ao Oscar 2017. In: Universidade Federal de Uberlândia. 2017.

JUNIOR, V. F., WOSZEZENKI, C., ANDERLE, D. F., SPERONI, R., NAKAYAMA, M. K. (2014). A pesquisa científica e tecnológica. Espacios, 35(9).

JUNQUEIRA, Kássio TC; DA ROCHA FERNANDES, Anita Maria. Análise de Sentimento em Redes Sociais no Idioma Português com Base em Mensagens do Twitter. Anais do Computer on the Beach, p. 681-690, 2018.

KIMBALL, Ralph; ROSS, Margy. The data warehouse toolkit: the complete guide to dimensional modeling. John Wiley & Sons, 2011.

MANSMANN, Svetlana. Building a Data Warehouse for Twitter Stream Exploration.In: University of Konstanz, Germany. 2012.

MORAES, Silvia et. al. 7x1•PT: um Corpus extraído do Twitter para Análise de Sentimentos em Língua Portuguesa. 2015.

NASCIMENTO, Paula et. al. Análise de sentimento de tweets com foco em notícias. 2012.

NOGUEIRA, Rodrigo R. Newsminer: um sistema de datawarehouse baseado em texto de notícias.In: Universidade Federal de São Carlos. 2017

PIZZANI, Luciana et. al. A arte da pesquisa bibliográfica na busca do conhecimento. In: Revista Digital de Biblioteconomia e Ciência da Informação. TAVARES, Jonatas et al. Soluções de BI 2.0 para Análise de Dados a partir do Twitter®: Eleições 2014.2017.

TREVISAN, Allan. MINERAÇÃO DE TEXTOS NO TWITTER .2015
Publicado
10/04/2019
SUTER, Jonathan; NOGUEIRA, Rodrigo; TOZZI, Tatiana; ANDERLE, Daniel; SPERONI, Rafael. Um Data Warehouse Textual em Língua Portuguesa: Estudo de caso do sentimento dos usuários do Twitter durante a eleição de 2018. In: ESCOLA REGIONAL DE BANCO DE DADOS (ERBD), 15. , 2019, Chapecó. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 41-50. ISSN 2595-413X. DOI: https://doi.org/10.5753/erbd.2019.8477.