Detecção e previsão de eventos de alto impacto utilizando dados de redes sociais online

  • Denise E. F. Brito UFMG
  • Wagner Meira Jr. UFMG

Resumo


Este trabalho tem como objetivo projetar, avaliar e aplicar modelos de regressão para detecção precoce de eventos utilizando dados públicos disponíveis em redes sociais online. O processo compreende quatro fases, que consistem em verificar a viabilidade de prever o evento através de dados informais, identificar os modelos a serem utilizados, calcular os parâmetros da função de previsão e avaliar o modelo num estudo de caso. O contexto é a epidemia de dengue no Brasil, integrando o projeto do Observatório da Dengue, onde os modelos resultantes foram capazes de prever a severidade dos surtos, numa escala semanal e para as maiores cidades brasileiras, para 99.12% dos valores de incidência da doença.

Referências

Bourke, P. (1996). Cross correlation. http://paulbourke.net/miscellaneous/correlate/.

Brito, D., Gomide, J., Santos, W., Meira Jr., W., Veloso, A., and Almeida, V. (2012). Um sistema de alarme para vigilância epidemiológica de rumores utilizando redes sociais. In Proceedings of the 27th Brazilian Symposium on Databases, pages 225–232.

Gomide, J. S. (2012). Mineração de Redes Sociais para Detecção e Previsão de Eventos Reais. Master’s thesis, Universidade Federal de Minas Gerais, BR.

Markovsky, I. and Van Huffel, S. (2007). Overview of total least-squares methods. Signal Process., 87(10):2283–2302.

Petras, I. and Bednarova, D. (2010). Total least squares method. http://www.mathworks.com/matlabcentral/fileexchange/31109.

R Development Core Team (2011). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria.

Veloso, A., Meira Jr., W., and Zaki, M. J. (2006). Lazy associative classification. In International Conference on Data Mining, pages 645–654. IEEE Computer Society.

Venables, W. N. and Ripley, B. D. (2002). Modern Applied Statistics with S. Springer, New York, fourth edition. ISBN 0-387-95457-0.

Ver Hoef, J. and Boveng, P. (2007). Quasi-poisson vs. negative binomial regression: how should we model overdispersed count data? Ecology, 88(11):2766–72.

Zeileis, A., Kleiber, C., and Jackman, S. (2008). Regression models for count data in r. Journal of Statistical Software, 27(8):1–25.
Publicado
23/07/2013
BRITO, Denise E. F.; MEIRA JR., Wagner. Detecção e previsão de eventos de alto impacto utilizando dados de redes sociais online. In: CONCURSO DE TRABALHOS DE INICIAÇÃO CIENTÍFICA DA SBC (CTIC-SBC), 32. , 2013, Maceió. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2013 . p. 142-151.