Utilizando a quantificação na análise de sentimentos em reviews de produtos
Resumo
A coleta de informações como reviews sobre os produtos tornou-se uma tarefa relevante para as empresas, pois expressam o sentimento de consumidores sobre um determinado item. Conhecer a quantidade de reviews positivos e negativos sobre um produto/serviço é uma tarefa de interesse que pode ser explorada pela quantificação. O objetivo deste trabalho é avaliar diferentes quantificadores aplicados a reviews de produtos, bem como a influência desses métodos na performance de classificação. Foram avaliados dez métodos de quantificação em seis conjuntos de dados de reviews de produtos. Como resultado observou-se que o método amplamente utilizado para resolver tarefas de quantificação é superado por oito métodos e que quantificadores podem ser utilizados para melhorar a classificação de reviews. Em ambos os casos observou-se diferença estatisticamente significativa.
Referências
Forman, G. (2005). Counting Positives Accurately Despite Inaccurate Classification. In Machine Learning: ECML 2005, volume 3720, pages 564–575. Springer Berlin Heidelberg, Berlin, Heidelberg.
Forman, G. (2007). Quantifying counts, costs, and trends accurately via machine learning. Technical report, Technical report, HP Laboratories, Palo Alto, CA.
González-Castro, V., Alaiz-Rodríguez, R., and Alegre, E. (2013). Class distribution estimation based on the Hellinger distance. Information Sciences, 218:146–164.
Griko Nibras (2018). Amazon Cell Phones Reviews. [link].
Hassan, W., Maletzke, A., and Batista, G. (2020). Accurately Quantifying a Billion Instances per Second. In 2020 IEEE 7th International Conference on Data Science and Advanced Analytics (DSAA), pages 1–10, Australia. IEEE.
Liu, Y., Ott, M., Goyal, N., Du, J., Joshi, M., Chen, D., Levy, O., Lewis, M., Zettlemoyer, L., and Stoyanov, V. (2019). RoBERTa: A Robustly Optimized BERT Pretraining Approach.
Maletzke, A., Dos Reis, D., Cherman, E., and Batista, G. (2019). DyS: A Framework for Mixture Models in Quantification. Proceedings of the AAAI Conference on Artificial Intelligence, 33(01):4552–4560.
Maletzke, A., Hassan, W., dos Reis, D., and Batista, G. (2020). The Importance of the Test Set Size in Quantification Assessment. In Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence, pages 2640–2646, Japan.
Medhat, W., Hassan, A., and Korashy, H. (2014). Sentiment analysis algorithms and applications: A survey. Ain Shams engineering journal, 5(4):1093–1113.
Ni, J., Li, J., and McAuley, J. (2019). Justifying Recommendations using Distantly-Labeled Reviews and Fine-Grained Aspects. In Proceedings of the Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), pages 188–197, China.
Sebastiani, F. (2020). Evaluation measures for quantification: An axiomatic approach. Information Retrieval Journal, 23(3):255–288.
Tsytsarau, M. and Palpanas, T. (2012). Survey on mining subjective data on the web. Data Mining and Knowledge Discovery, 24:478–514.