Data Science and Transparency: Experiences with Public Data from SICOM
Abstract
This paper presents the experience report of the Programa Capacidades Analíticas (PCA) on the use of the public database from the Sistema Informatizado de Contas dos Municípios (SICOM) for applying data science to governmental expenditures. Using the SICOM database, PCA developed advanced techniques in artificial intelligence and data science to analyze public procurement, municipal expenditures, and detect irregularities.
Keywords:
SICOM, transparency, e-government
References
Brandão, M. A. et al. (2024). Plus: A semi-automated pipeline for fraud detection in public bids. Digit. Gov.: Res. Pract., 5(1).
Braz, C. S. et al. (2023). Análise de irregularidades em licitações públicas com foco em empresas de pequeno porte. In WCGE, pages 94–105. SBC.
Braz, C. S. et al. (2024). Exploring irregularities in brazilian public bids: An in-depth analysis on small companies. Journal on Interactive Systems, 15(1):349–361.
Brum, P. P. V. et al. (2024). Unsupervised grouping of public procurement similar items: Which text representation should I use? In LREC-COLING, pages 17176–17185. ELRA and ICCL.
Costa, L. G. L. et al. (2024). Quanto Custa: Banco de Preços de Compras Públicas do Estado de Minas Gerais. In SBBD DS-CoPS. SBC.
Costa, L. L. et al. (2022). Alertas de fraude em licitações: Uma abordagem baseada em redes sociais. In BraSNAM, pages 37–48. SBC.
Costa, L. L. et al. (2023). Identification of suspected fraud bids through audit trails. iSys - Brazilian Journal of Information Systems, 16(1):13:1–13:23.
Gomide, L. D. et al. (2023). Mineração de dados sobre despesas públicas de municípios mineiros para gerar alertas de fraudes. In SBBD, pages 378–383. SBC.
Mendes, B. M. A. et al. (2023). Impacto de Doações Eleitorais no Faturamento de Empresas: Um Estudo nas Eleições Municipais em Minas Gerais. In SBBD, pages 420–425. SBC.
Oliveira, G. P. et al. (2022a). Detecting inconsistencies in public bids: An automated and data-based approach. In WebMedia, pages 182–190. ACM.
Oliveira, G. P. et al. (2022b). Ferramentas open-source de qualidade de dados para licitações públicas: Uma análise comparativa. In SBBD, pages 116–127. SBC.
Oliveira, G. P. et al. (2023a). Assessing data quality inconsistencies in brazilian governmental data. Journal of Information and Data Management, 14(1).
Oliveira, G. P. et al. (2023b). Ranqueamento de licitações públicas a partir de alertas de fraude. In BraSNAM, pages 1–12, Porto Alegre, RS, Brasil. SBC.
Oliveira, G. P. et al. (2024). ICPSet: Um Conjunto de Dados Estruturados de Itens de Compras Públicas. In DSW. SBC.
Silva, M. O. et al. (2023). Análise de sobrepreço em itens de licitações públicas. In WCGE, pages 118–129. SBC.
Silva, M. O. et al. (2024a). Evaluating domain-adapted language models for governmental text classification tasks in portuguese. In SBBD. SBC.
Silva, M. O. et al. (2024b). Overpricing analysis in brazilian public bidding items. Journal on Interactive Systems, 15(1):130–142.
Braz, C. S. et al. (2023). Análise de irregularidades em licitações públicas com foco em empresas de pequeno porte. In WCGE, pages 94–105. SBC.
Braz, C. S. et al. (2024). Exploring irregularities in brazilian public bids: An in-depth analysis on small companies. Journal on Interactive Systems, 15(1):349–361.
Brum, P. P. V. et al. (2024). Unsupervised grouping of public procurement similar items: Which text representation should I use? In LREC-COLING, pages 17176–17185. ELRA and ICCL.
Costa, L. G. L. et al. (2024). Quanto Custa: Banco de Preços de Compras Públicas do Estado de Minas Gerais. In SBBD DS-CoPS. SBC.
Costa, L. L. et al. (2022). Alertas de fraude em licitações: Uma abordagem baseada em redes sociais. In BraSNAM, pages 37–48. SBC.
Costa, L. L. et al. (2023). Identification of suspected fraud bids through audit trails. iSys - Brazilian Journal of Information Systems, 16(1):13:1–13:23.
Gomide, L. D. et al. (2023). Mineração de dados sobre despesas públicas de municípios mineiros para gerar alertas de fraudes. In SBBD, pages 378–383. SBC.
Mendes, B. M. A. et al. (2023). Impacto de Doações Eleitorais no Faturamento de Empresas: Um Estudo nas Eleições Municipais em Minas Gerais. In SBBD, pages 420–425. SBC.
Oliveira, G. P. et al. (2022a). Detecting inconsistencies in public bids: An automated and data-based approach. In WebMedia, pages 182–190. ACM.
Oliveira, G. P. et al. (2022b). Ferramentas open-source de qualidade de dados para licitações públicas: Uma análise comparativa. In SBBD, pages 116–127. SBC.
Oliveira, G. P. et al. (2023a). Assessing data quality inconsistencies in brazilian governmental data. Journal of Information and Data Management, 14(1).
Oliveira, G. P. et al. (2023b). Ranqueamento de licitações públicas a partir de alertas de fraude. In BraSNAM, pages 1–12, Porto Alegre, RS, Brasil. SBC.
Oliveira, G. P. et al. (2024). ICPSet: Um Conjunto de Dados Estruturados de Itens de Compras Públicas. In DSW. SBC.
Silva, M. O. et al. (2023). Análise de sobrepreço em itens de licitações públicas. In WCGE, pages 118–129. SBC.
Silva, M. O. et al. (2024a). Evaluating domain-adapted language models for governmental text classification tasks in portuguese. In SBBD. SBC.
Silva, M. O. et al. (2024b). Overpricing analysis in brazilian public bidding items. Journal on Interactive Systems, 15(1):130–142.
Published
2024-10-14
How to Cite
COSTA, Lucas G. L.; DUTRA, Marco Túlio; OLIVEIRA, Gabriel P.; SILVA, Mariana O.; CRUZ SOARES, Daniela; SILVA FARIA, Luciana de Cássia; MEIRA JR., Wagner; PAPPA, Gisele L..
Data Science and Transparency: Experiences with Public Data from SICOM. In: WORKSHOP ON DATA SCIENCE AGAINST CORRUPTION IN THE PUBLIC SECTOR (DS-COPS) - BRAZILIAN SYMPOSIUM ON DATABASES (SBBD), 39. , 2024, Florianópolis/SC.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2024
.
p. 246-252.
DOI: https://doi.org/10.5753/sbbd_estendido.2024.243805.
