Quantificando a Importância de Emojis e Emoticons para Identificação de Polaridade em Avaliações Online
Resumo
Ambientes virtuais como lojas online de produtos e serviços (e.g. Amazon, Google Play, Booking) adotam uma estratégia colaborativa de avaliação e reputação onde os usuários classificam os produtos e serviços. A opinião do usuário representa o grau seu de satisfação em relação ao item avaliado. O conjunto de avaliações de um item é referencial de sua reputação/qualidade. Portanto, a identificação automática da satisfação do usuário em relação a um item, considerando sua avaliação textual, é uma ferramenta com potencial econômico singular. Neste contexto, com a popularização de emojis e emoticons, intensificada pelo uso de dispositivos móveis e seus aplicativos, os usuários adotam cada vez mais estes símbolos como parte do vocabulário utilizado para expressar opini˜oes e sentimentos. Neste trabalho, apresentamos uma avaliação quantitativa da representatividade de emojis/ emoticons para a identificação de opinião e polaridade em ambientes online de avaliação colaborativa. A abordagem proposta quantifica o uso da técnica Bag of Words com SVM para determinar o grau de satisfação do usuário em relação a um item, considerando: (1) palavras e emojis/emoticons; (2) apenas palavras; (3) apenas emojis/emoticons. Particularmente, para cenários específicos o uso de emojis/emoticons para a análise de sentimentos chega a ter uma eficácia de 0,70, contra 0,65 quando utilizamos apenas as palavras, considerando a métrica F1.
Referências
Almeida, T. G., Souza, B. A., Menezes, A. A., Figueiredo, C., e Nakamura, E. F. (2016a). Sentiment analysis of portuguese comments from foursquare. In Proceedings of the 22nd Brazilian Symposium on Multimedia and the Web, pages 355–358. ACM.
Almeida, T. G., Souza, B. A., Menezes, A. A., Figueiredo, C. M., e Nakamura, E. F. (2016b). Sentiment analysis of portuguese comments from foursquare. In Proceedings of the 22Nd Brazilian Symposium on Multimedia and the Web, Webmedia ’16, pages 355–358, New York, NY, USA. ACM.
Araújo, M., Gonçalves, P., Cha, M., e Benevenuto, F. (2014). ifeel: a system that compares and combines sentiment analysis methods. In Proceedings of the 23rd International Conference on World Wide Web, pages 75–78. ACM.
Jo, Y. e Oh, A. H. (2011). Aspect and sentiment unification model for online review analysis. In Proceedings of the Fourth ACM International Conference on Web Search and Data Mining, WSDM ’11, pages 815–824, New York, NY, USA. ACM.
Leskovec, J. e Krevl, A. (2014). SNAP Datasets: Stanford large network dataset collection. http://snap.stanford.edu/data.
Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis lectures on human language technologies, 5(1):1–167.
Martins, R. F., Pereira, A., e Benevenuto, F. (2015). An approach to sentiment analysis of web applications in portuguese. In Proceedings of the 21st ACM Brazilian Symposium on Multimedia and the Web, pages 105–112. ACM.
McAuley, J., Pandey, R., e Leskovec, J. (2015). Inferring networks of substitutable and complementary products. In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 785–794. ACM.
Montejo-Ráez, A., Martínez-Cámara, E., Martín-Valdivia, M. T., e Ureña-López, L. A. (2014). Ranked wordnet graph for sentiment polarity classification in twitter. Computer Speech & Language, 28(1):93–107.
Moraes, F., Vasconcelos, M., Prado, P., Almeida, J., e Gonçalves, M. (2013). Polarity analysis of micro reviews in foursquare. In Proceedings of the 19th Brazilian symposium on Multimedia and the web (WebMedia), pages 113–120. ACM.
Pang, B. e Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and trends in information retrieval, 2(1-2):1–135.
Pang, B., Lee, L., e Vaithyanathan, S. (2002). Thumbs up?: sentiment classification using machine learning techniques. In Proceedings of the 2002 ACL Conference on Empirical methods in natural language processing (ACL-02), pages 79–86. Association for Computational Linguistics (ACL).
Reis, J., Miranda, M., Bastos, L., Prates, R., e Benevenuto, F. (2016). Uma análise do impacto do anonimato em comentários de notícias online.
Serrano-Guerrero, J., Olivas, J. A., Romero, F. P., e Herrera-Viedma, E. (2015). Sentiment analysis: a review and comparative analysis of web services. Information Sciences, 311:18–38.
Souza, B. A., Almeida, T. G., Menezes, A. A., Nakamura, F. G., Figueiredo, C. M., e Nakamura, E. F. (2016). For or against?: Polarity analysis in tweets about impeachment process of brazil president. In Proceedings of the 22Nd Brazilian Symposium on Multimedia and the Web, Webmedia ’16, pages 335–338, New York, NY, USA. ACM.
Terrana, D., Augello, A., e Pilato, G. (2014). Automatic unsupervised polarity detection on a twitter data stream. In Semantic Computing (ICSC), 2014 IEEE International Conference on, pages 128–134. IEEE.
Turney, P. D. (2002). Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews. In Proceedings of the 40th Annual Meeting on Association for Computational Linguistics, pages 417–424. Association for Computational Linguistics.
Wilson, T., Wiebe, J., e Hoffmann, P. (2009). Recognizing contextual polarity: An exploration of features for phrase-level sentiment analysis. Computational Linguistics, 35(3):399–433.
Ye, Q., Zhang, Z., e Law, R. (2009). Sentiment classification of online reviews to travel destinations by supervised machine learning approaches. Expert Systems with Applications, 36(3):6527–6535.