Caramel: Um Framework para Ecossistema de Big Social Data

  • Paulo Freitas Silva Júnior UFRJ
  • Tiago França UFRRJ
  • Jonice Oliveira UFRJ

Resumo


As principais ferramentas de análise de mídias sociais geram silos que dificultam a gestão de dados e a colaboração interdisciplinar. Este trabalho propõe o CARAMEL, uma arquitetura de referência baseada em microsserviços e mensageria assíncrona para orquestrar ecossistemas distribuídos de Big Social Data. O framework automatiza a curadoria de metadados, garantindo a rastreabilidade e a proveniência da informação ao longo de todo o seu ciclo de vida, além de permitir a personalização dos fluxos de análise. Validada com volumes massivos nas eleições de 2022 e 2024, a infraestrutura integra diferentes atores, reduz barreiras técnicas e facilita o suporte tecnológico, o reuso de artefatos e a colaboração ativa em pesquisas sociotécnicas.

Referências

ANWAR, M. J., GILL, A. Q., HUSSAIN, F. K., and IMRAN, M. (2021). Secure big data ecosystem architecture: challenges and solutions. EURASIP Journal on Wireless Communications and Networking, 2021:130.

BELLO-ORGAZ, G., JUNG, J. J., and CAMACHO, D. (2016). Social big data: Recent achievements and new challenges. Information Fusion, 28:45–59.

DEMIRBAGA, U. (2023). HTwitt: a hadoop-based platform for analysis and visualization of streaming Twitter data. Neural Computing and Applications, 35(33):23893–23908.

DRESCH, A., Lacerda, D. P., and ANTUNES JR, J. A. V. (2014). Design science research. In Design science research: A method for science and technology advancement, pages 67–102. Springer.

FRANÇA, T. C. (2019). Andare: Um Framework Para Inclusão Da Análise De Dados De Mídias Sociais No Contexto Da Preparação E Resposta À Emergência Em Situações De Manifestações De Massa. Tese (doutorado), Universidade Federal do Rio de Janeiro.

FRANÇA, T. C., FARIA, F. F., RANGEL, F., FARIAS, C. M., and OLIVEIRA, J. (2014). Big Social Data: Princípios sobre Coleta, Tratamento e Análise de Dados Sociais. In XXIX Simpósio Brasileiro de Banco de Dados, volume 14, page 38. Ed. Porto Alegre.

GROSSI, V., GIANNOTTI, F., PEDRESCHI, D., MANGHI, P., PAGANO, P., and ASSANTE, M. (2021). Data science: a game changer for science and innovation. International Journal of Data Science and Analytics, 11(4):263–278.

GROSSI, V., RAPISARDA, B., GIANNOTTI, F., and PEDRESCHI, D. (2018). Data science at sobigdata: the european research infrastructure for social mining and big data analytics. International Journal of Data Science and Analytics, 6:205–216.

GROVER, P. and KAR, A. K. (2017). Big Data Analytics: A Review on Theoretical Contributions and Tools Used in Literature. Global Journal of Flexible Systems Management, 18(3):203–229.

HARGREAVES, E., MANGABEIRA, E. F., OLIVEIRA, J., FRANCA, T. C., and MCNASCHE, D. S. (2020). Facebook news feed personalization filter: a case study during the brazilian elections. In 2020 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM), pages 615–618, Netherlands. IEEE, IEEE.

LIMA, G. d. F. B., OLIVEIRA, M. I. S., and LÓSCIO, B. F. (2022). FASED: A Framework for Data Ecosystems Health Evaluation. Journal of Information and Data Management, 13(3).

LIMA FILHO, S. P., OLIVEIRA, J., and DA SILVA, M. F. (2020). Detection of depression symptoms using social media data. Simpósio Brasileiro de Banco de Dados (SBBD), 2020:3–8.

OLIVEIRA, M. I. S., LIMA, G. d. F. B., and LÓSCIO, B. F. (2019). Investigations into Data Ecosystems: a systematic mapping study. Knowledge and Information Systems, 61(2):589–630.

OLSHANNIKOVA, E., OLSSON, T., HUHTAMÄKI, J., and KÄRKKÄINEN, H. (2017). Conceptualizing Big Social Data. Journal of Big Data, 4(1):3.

REHEM, D., OLIVEIRA, J., FRANÇA, T., BRITO, W., and MOTTA, C. (2016). News recommendation based on tweets for understanding of opinion variation and events. In Proceedings of the 31st Annual ACM Symposium on Applied Computing, pages 1182–1185, New York, NY, USA. ACM.

ROSSETTI, G., MILLI, L., RINZIVILLO, S., SIRBU, A., PEDRESCHI, D., and GIANNOTTI, F. (2017). Ndlib: Studying network diffusion dynamics. In 2017 IEEE International Conference on Data Science and Advanced Analytics (DSAA), pages 155–164.

SHAH, S. I. H., PERISTERAS, V., and MAGNISALIS, I. (2021). DaLiF: a data lifecycle framework for data-driven governments. Journal of Big Data, 8(1):89.

SILVA JÚNIOR, P. F., FRANÇA, T. C., and OLIVEIRA, J. (2023a). Caramel: Ecosystem for big social data. In Proceedings of the XIX Brazilian Symposium on Information Systems, volume 1, pages 136–142. ACM.

SILVA JÚNIOR, P. F., FRANÇA, T. C., and OLIVEIRA, J. (2023b). Caramel: Um framework para ecossistema de big social data. In Anais Estendidos do XXXVIII Simpósio Brasileiro de Banco de Dados (SBBD Estendido 2023), pages 167–173. Sociedade Brasileira de Computação - SBC.

WANG, X., DUAN, Q., and LIANG, M. (2021). Understanding the process of data reuse: An extensive review. Journal of the Association for Information Science and Technology, 72(9):1161–1182.
Publicado
19/07/2026
SILVA JÚNIOR, Paulo Freitas; FRANÇA, Tiago; OLIVEIRA, Jonice. Caramel: Um Framework para Ecossistema de Big Social Data. In: CONCURSO DE TESES E DISSERTAÇÕES DA SBC (CTD-SBC), 39. , 2026, Gramado/RS. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2026 . p. 90-99. ISSN 2763-8820. DOI: https://doi.org/10.5753/ctd.2026.19719.