Relacionamento estatístico entre indicadores de dados de internet em língua portuguesa e bolsa de valores
Resumo
Este trabalho apresenta uma análise estatística entre indicadores obtidos de dados de internet em língua portuguesa - sentimento de notícias e Google Trends - e dados sobre o mercado brasileiro de bolsa de valores através do coeficiente de correlação de postos de Spearman. A metodologia utilizada para coleta, pré-processamento e obtenção de cada indicador é detalhada. Foram obtidos dados dos anos de 2019 a 2021. Para a análise de sentimento das notícias foi adotado um modelo CNN (Convolutional Neural Network) o qual obteve um F1-score de 96%. Como resultados foram obtidas algumas correlações interessantes dentre as quais, uma correlação inversa caracterizada como moderada (segundo a escala de Cohen) entre o sentimento das notícias e preço de fechamento ajustado em 2019; entre volume de buscas e preço de fechamento, uma correlação negativa e “muito grande” e positiva e “grande” entre o volume de negociações e o volume de buscas. Tanto em 2020 como em 2021, constatou-se coeficientes negativos definidos como “grandes”, levando em conta o preço de fechamento e volume de negociações.
Referências
B3 (2022). Data de acesso: 28 de julho de 2022.
Bhardwaj, B., Ahmed, S. I., Jaiharie, J., Sorabh Dadhich, R., and Ganesan, M. (2021). Web scraping using summarization and named entity recognition (ner). In 2021 7th International Conference on Advanced Computing and Communication Systems (ICACCS), volume 1, pages 261–265.
Carosia, A. E. O., Coelho, G. P., and Silva, A. E. A. (2019). Analyzing the brazilian financial market through portuguese sentiment analysis in social media. Applied Artificial Intelligence, 34(1):1–19.
Cohen, J., Cohen, P., West, S. G., and Aiken, L. S. (2003). Applied multiple regression/correlation analysis for the behavioral sciences. L. Erlbaum Associates, Mahwah, N.J., 3rd ed. edition.
Díaz, F. and Henríquez, P. A. (2021). Social sentiment segregation: Evidence from twitter and google trends in chile during the covid-19 dynamic quarantine strategy. PLoS ONE, 16.
Fama, E. F. (1970). Efficient Capital Markets: A Review of Theory and Empirical Work. Journal of Finance, 25(2):383–417.
FARIA, L. J., SILVA, K. C., Fernandes, M. G. C., FERNANDES, D. S. A., and SOARES, F. (2022). Tweet and news sentiment indicators and the behavior of the brazilian stock market. In Proceedings of the 21st ACM IEEE International Conference on Industrial Informatics, Perth, Australia. IEEE.
GlobalStats, S. (2022). Data de acesso: 19 de julho de 2022.
Kabbani, T. and Usta, F. (2022). Predicting the stock trend using news sentiment analysis and technical indicators in spark.
Peres, V., Vieira, R., and Bordini, R. (2019). Análises de Sentimentos: Abordagem lexical de classificação de opinião no contexto mercado financeiro brasileiro. Workshop of Artificial Intelligence Applied to Finance.
Shapiro, S. S. and Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). Biometrika, 52(3/4):591–611.
Silva, C. and Machado, M. (2020). The effect of foreign investment flow on commonality in liquidity on the brazilian stock market. Revista Contabilidade & Finanças, 31.
Thomas, D. M. and Mathur, S. (2019). Data analysis by web scraping using python. In 2019 3rd International conference on Electronics, Communication and Aerospace Technology (ICECA), pages 450–454.
Thota, P. and Ramez, E. (2021). Web scraping of covid-19 news stories to create datasets for sentiment and emotion analysis. In The 14th PErvasive Technologies Related to Assistive Environments Conference, PETRA 2021, page 306–314, New York, NY, USA. Association for Computing Machinery.