Memorial Digital Coletivo Automatizado: um fluxo de trabalho com IA para curadoria de dados
Resumo
Introdução: A montagem de memoriais digitais coletivos a partir de dados públicos exige fluxos de trabalho que equilibrem velocidade; privacidade e sensibilidade cultural. Objetivo: Propor um fluxo de trabalho de quatro etapas para gerar memoriais digitais coletivos a partir de dados disponíveis na web. Etapas: raspagem das fontes; limpeza do conteúdo; classificação dos itens com o modelo Gemma 3-1B executado localmente e produção de resumos automáticos. Resultados: em testes com dois perfis reais; o tempo de montagem caiu de cerca de 25 min para 1;6 min (redução de 93 %) e a organização por seções alcançou cerca de 85 % de acerto. O sistema opera localmente; preserva a privacidade e exige revisão humana para garantir sensibilidade cultural. As limitações incluem o conjunto de teste restrito e a dependência de um modelo compacto. Trabalhos futuros envolvem o uso de modelos maiores; suporte multimodal e avaliações com familiares enlutados.
Referências
Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python: analyzing text with the natural language toolkit. O'Reilly Media, Inc.
Brown, M. A., Gruen, A., Maldoff, G., Messing, S., Sanderson, Z., & Zimmer, M. (2024). Web Scraping for Research: Legal, Ethical, Institutional, and Scientific
Considerations. arXiv preprint arXiv:2410.23432. Disponível em: [link]. Acesso em: 20 ago. 2025.
Creswell, J. W., Creswell, J. D. (2018). Research Design: Qualitative, Quantitative, and Mixed Methods Approaches. SAGE Publications, Los Angeles, CA, 5th edition.
Dados Além da Vida (DAVI). (2025). DAVI | Dados Além da Vida. Disponível em: [link]. Acesso em: 20 ago. 2025.
Gemma Team. (2025). Gemma 3 Technical Report. arXiv preprint arXiv:2503.19786. Disponível em: [link]. Acesso em: 20 ago. 2025.
Gil, A. C. (2019). Como elaborar projetos de pesquisa. 6. ed. São Paulo: Atlas.
Lopes, A. D., Maciel, M., & Pereira, V. C. (2014). Recomendações para o design de memórias digitais na web social. In Proceedings of the 13th Brazilian Symposium on Human Factors in Computing Systems (IHC '14). Sociedade Brasileira de Computação, 275–284.
McKinney, W. (2010). Data structures for statistical computing in Python. In Proceedings of the 9th Python in Science Conference (pp. 51-56).
Ni, J., Li, J., & McAuley, J. (2021). Sentence-T5: Scalable sentence encoders from pre-trained text-to-text models. arXiv preprint arXiv:2108.08877. Disponível em: [link]. Acesso em: 20 ago. 2025.
Öhman, C. J., & Watson, D. (2019). Are the dead taking over Facebook? A Big Data approach to the future of death online. Big Data & Society, 6(1), 2053951719842540. DOI: 10.1177/2053951719842540. Acesso em: 20 ago. 2025.
Pereira, R.; et al. (2024). GranDIHC-BR: Grand Research Challenges in Human-Computer Interaction in Brazil for 2025–2035. IHC 2024 – Anais Estendidos. Disponível em: [link]. Acesso em: 20 ago. 2025.
Reitz, K. (2025). Requests: HTTP for Humans. Disponível em: [link]. Acesso em: 20 ago. 2025.
Richardson, L. (2025). Beautiful Soup. Disponível em: [link]. Acesso em: 20 ago. 2025.
Selenium Developers. (2025). Selenium WebDriver. Disponível em: [link]. Acesso em: 20 ago. 2025.
Sommerville, I. (2015). Software Engineering. 10th Edition, Pearson Education Limited, Boston.
Trevisan, D., Maciel, C., & Bim, S. A. (2021). Educação, morte e tecnologias - experiência no ensino de avaliação em IHC. In Anais Estendidos do XX Simpósio Brasileiro de Fatores Humanos em Sistemas Computacionais (IHC), 56-63. Porto Alegre: SBC. Disponível em: [link]. Acesso em: 20 ago. 2025.
Ueda, G., Monteiro, L. F. F., Maciel, C., & Pereira, V. C. (2022). Digital memorials: classifications and design recommendations. Journal on Interactive Systems, 13(1), 335–349. Disponível em: [link]. Acesso em: 20 ago. 2025.
Wolf, T., et al. (2019). HuggingFace’s Transformers: State-of-the-art Natural Language Processing. arXiv 1910.03771. Disponível em: [link]. Acesso em: 20 ago. 2025.
