Data Science and Transparency: Experiences with Public Data from SICOM

  • Lucas G. L. Costa Federal University of Minas Gerais (UFMG)
  • Marco Túlio Dutra Federal University of Minas Gerais (UFMG) / Federal University of Ouro Preto (UFOP) https://orcid.org/0009-0000-3865-5799
  • Gabriel P. Oliveira Federal University of Minas Gerais (UFMG) https://orcid.org/0000-0002-7210-6408
  • Mariana O. Silva Federal University of Minas Gerais (UFMG)
  • Daniela Cruz Soares Ministry of Public Affairs of the State of Minas Gerais (MPMG)
  • Luciana de Cássia Silva Faria Ministry of Public Affairs of the State of Minas Gerais (MPMG)
  • Wagner Meira Jr. Federal University of Minas Gerais (UFMG)
  • Gisele L. Pappa Federal University of Minas Gerais (UFMG)

Abstract


This paper presents the experience report of the Programa Capacidades Analíticas (PCA) on the use of the public database from the Sistema Informatizado de Contas dos Municípios (SICOM) for applying data science to governmental expenditures. Using the SICOM database, PCA developed advanced techniques in artificial intelligence and data science to analyze public procurement, municipal expenditures, and detect irregularities.
Keywords: SICOM, transparency, e-government

References

Brandão, M. A. et al. (2024). Plus: A semi-automated pipeline for fraud detection in public bids. Digit. Gov.: Res. Pract., 5(1).

Braz, C. S. et al. (2023). Análise de irregularidades em licitações públicas com foco em empresas de pequeno porte. In WCGE, pages 94–105. SBC.

Braz, C. S. et al. (2024). Exploring irregularities in brazilian public bids: An in-depth analysis on small companies. Journal on Interactive Systems, 15(1):349–361.

Brum, P. P. V. et al. (2024). Unsupervised grouping of public procurement similar items: Which text representation should I use? In LREC-COLING, pages 17176–17185. ELRA and ICCL.

Costa, L. G. L. et al. (2024). Quanto Custa: Banco de Preços de Compras Públicas do Estado de Minas Gerais. In SBBD DS-CoPS. SBC.

Costa, L. L. et al. (2022). Alertas de fraude em licitações: Uma abordagem baseada em redes sociais. In BraSNAM, pages 37–48. SBC.

Costa, L. L. et al. (2023). Identification of suspected fraud bids through audit trails. iSys - Brazilian Journal of Information Systems, 16(1):13:1–13:23.

Gomide, L. D. et al. (2023). Mineração de dados sobre despesas públicas de municípios mineiros para gerar alertas de fraudes. In SBBD, pages 378–383. SBC.

Mendes, B. M. A. et al. (2023). Impacto de Doações Eleitorais no Faturamento de Empresas: Um Estudo nas Eleições Municipais em Minas Gerais. In SBBD, pages 420–425. SBC.

Oliveira, G. P. et al. (2022a). Detecting inconsistencies in public bids: An automated and data-based approach. In WebMedia, pages 182–190. ACM.

Oliveira, G. P. et al. (2022b). Ferramentas open-source de qualidade de dados para licitações públicas: Uma análise comparativa. In SBBD, pages 116–127. SBC.

Oliveira, G. P. et al. (2023a). Assessing data quality inconsistencies in brazilian governmental data. Journal of Information and Data Management, 14(1).

Oliveira, G. P. et al. (2023b). Ranqueamento de licitações públicas a partir de alertas de fraude. In BraSNAM, pages 1–12, Porto Alegre, RS, Brasil. SBC.

Oliveira, G. P. et al. (2024). ICPSet: Um Conjunto de Dados Estruturados de Itens de Compras Públicas. In DSW. SBC.

Silva, M. O. et al. (2023). Análise de sobrepreço em itens de licitações públicas. In WCGE, pages 118–129. SBC.

Silva, M. O. et al. (2024a). Evaluating domain-adapted language models for governmental text classification tasks in portuguese. In SBBD. SBC.

Silva, M. O. et al. (2024b). Overpricing analysis in brazilian public bidding items. Journal on Interactive Systems, 15(1):130–142.
Published
2024-10-14
COSTA, Lucas G. L.; DUTRA, Marco Túlio; OLIVEIRA, Gabriel P.; SILVA, Mariana O.; CRUZ SOARES, Daniela; SILVA FARIA, Luciana de Cássia; MEIRA JR., Wagner; PAPPA, Gisele L.. Data Science and Transparency: Experiences with Public Data from SICOM. In: WORKSHOP ON DATA SCIENCE AGAINST CORRUPTION IN THE PUBLIC SECTOR (DS-COPS) - BRAZILIAN SYMPOSIUM ON DATABASES (SBBD), 39. , 2024, Florianópolis/SC. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 246-252. DOI: https://doi.org/10.5753/sbbd_estendido.2024.243805.