CONO: Um Coletor Automatizado de Notícias sobre Corrupção em Santa Catarina

  • Ana Clara Stupp de Souza UFSC
  • Carina F. Dorneles UFSC

Resumo


Na era da informação, estar bem informado é essencial, mas o volume avassalador de notícias torna difícil extrair dados relevantes de forma eficiente. O Ministério Público de Santa Catarina depende de informações estratégicas para conduzir investigações, mas enfrenta dificuldades devido à sobrecarga de informações. Para resolver isso, foi desenvolvida a ferramenta CONO — um crawler construído com JavaScript e Python para coletar e filtrar automaticamente notícias relacionadas à corrupção. Este artigo apresenta o processo de desenvolvimento da ferramenta, as tecnologias subjacentes, o fluxo operacional e os resultados alcançados na otimização da coleta de dados para fins investigativos.

Referências

Chakrabarti, S. (2009). Focused Web Crawling, pages 1147–1155. Springer US, Boston, MA.

de Paula, T. S. (2022). Classificação de notícias de fraude e corrupção em português para instauração de processo investigativo. Master’s thesis, Centro Federal de Educação Tecnológica Celso Suckow da Fonseca, Rio de Janeiro.

Moraes, M. P. (2019). Mineração de dados aplicada à identificação de notícias falsas.

Reips, L., Musicante, M., Vargas-Solar, G., Pozo, A., and Hara, C. (2023). Enow - extrator de dados de notícias da web. In Anais Estendidos do XXXVIII Simpósio Brasileiro de Bancos de Dados, pages 78–83, Porto Alegre, RS, Brasil. SBC.
Publicado
23/04/2025
SOUZA, Ana Clara Stupp de; DORNELES, Carina F.. CONO: Um Coletor Automatizado de Notícias sobre Corrupção em Santa Catarina. In: ESCOLA REGIONAL DE BANCO DE DADOS (ERBD), 20. , 2025, Florianópolis/SC. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2025 . p. 129-132. ISSN 2595-413X. DOI: https://doi.org/10.5753/erbd.2025.7026.