Um estudo de caso de mineração de emoções em textos multilíngues
Resumo
O objetivo da Mineração de Opinião Multilíngue é extrair e analisar textos contendo opiniões, independente do idioma no qual estão escritos. A grande maioria dos trabalhos desta área foca apenas na classificação da polaridade do sentimento, sendo que a análise das emoções é pouco explorada. A fim de preencher esta lacuna, este trabalho apresenta um estudo de caso sobre a classificação das emoções presentes em revisões de produtos, avaliando uma abordagem que combina a classificação de emoções baseada em dicionário e tradução automática. O estudo de caso tem por objetivo identificar se é preferível traduzir o texto das revisões ou as palavras do dicionário, além de avaliar se a aplicação de um lematizador melhora os resultados. Os resultados dos experimentos em dados reais mostram que a tradução das revisões produz melhores resultados e que a lematização não traz mudanças significativas.
Referências
Bader, B. W., Kegelmeyer, W. P., & Chew, P. A. Multilingual sentiment analysis using latent semantic indexing and machine learning. In Data mining workshops (icdmw), (pp. 45–52), 2011.
Balahur, A., & Turchi, M. Comparative Experiments for Multilingual Sentiment Analysis Using Machine Translation. In SDAD 2012 The 1st International Workshop on Sentiment Discovery from Affective Data (p. 75), 2012.
Banea, C., Mihalcea, R., Wiebe, J., & Hassan, S. Multilingual subjectivity analysis using machine translation. In EMNLP (pp. 127–135), 2008.
Banea, C., Mihalcea, R., & Wiebe, J. Multilingual subjectivity: are more languages better? In ACL (pp. 28–36), 2010.
Becker, K., & Tumitan, D. Introdução à Mineração de Opiniões: Conceitos, Aplicações e Desafios. Simpósio Brasileiro de Banco de Dados, 2013.
Bollen, J., Mao, H., & Zeng, X. Twitter mood predicts the stock market. Journal of Computational Science, 2(1), 1-8, 2011.
Ekman, P. An argument for basic emotions. Cognition & Emotion 6.3-4: 169-200, 1992.
Lin, Z., Tan, S., & Cheng, X. Language-independent sentiment classification using three common words. CIKM (pp. 1041–1046), 2011.
Liu, B. Sentiment analysis and opinion mining. Synthesis Lectures on Human Language Technologies, 5(1), 1–167, 2012.
Mihalcea, R., Banea, C. & Wiebe, J. Learning multilingual subjective language via cross-lingual projections. ACL 2007.
Mohammad, S. M. & Turney, P. D. NRC Emotion Lexicon. NRC Technical Report, 2013, December.
Narr, S., Hülfenhaus, M. & Albayrak, S. Language-independent twitter sentiment analysis. KDML, 2012.
Ortony, A., & Turner, T. J. What’s basic about basic emotions? Psychological review, 97(3), 315, 1990.
Tsytsarau, M., & Palpanas, T. Survey on mining subjective data on the web. Data Mining and Knowledge Discovery, 24(3), 478–514, 2012.
Wiebe, J., Wilson, T., & Cardie, C.. Annotating expressions of opinions and emotions in language. Language resources and evaluation, 39(2-3):165–210, 2005.