LiPSet: Um conjunto de Dados com Documentos Rotulados de Licitações Públicas

  • Mariana O. Silva Universidade Federal de Minas Gerais
  • Amanda F. Paula Universidade Federal de Minas Gerais
  • Gabriel P. Oliveira Universidade Federal de Minas Gerais https://orcid.org/0000-0002-7210-6408
  • Iago A. D. Vaz Universidade Federal de Minas Gerais
  • Henrique Hott Universidade Federal de Minas Gerais
  • Larissa D. Gomide Universidade Federal de Minas Gerais
  • Arthur P. G. Reis Universidade Federal de Minas Gerais
  • Bárbara M. A. Mendes Universidade Federal de Minas Gerais
  • Clara A. Bacha Universidade Federal de Minas Gerais
  • Lucas L. Costa Universidade Federal de Minas Gerais
  • Michele A. Brandão Universidade Federal de Minas Gerais / Instituto Federal de Minas Gerais
  • Anisio Lacerda Universidade Federal de Minas Gerais
  • Gisele L. Pappa Universidade Federal de Minas Gerais

Resumo


Neste trabalho, é apresentado o LiPSet, um conjunto de dados com documentos rotulados de licitações públicas de Minas Gerais. Após uma visão geral do processo de coleta e rotulação manual, uma breve análise exploratória de dados é apresentada para resumir as principais características e contribuições do conjunto de dados proposto. Além disso, são discutidas potenciais aplicações e principais desafios que envolvem o uso do LiPSet.

Palavras-chave: conjunto de dados, dados abertos governamentais, licitações públicas, dados rotulados, meta-classe

Referências

Abidi, W. U. H. et al. (2021). Real-time shill bidding fraud detection empowered with fussed machine learning. IEEE Access, 9:113612–113621.

Anowar, F. and Sadaoui, S. (2019). Multi-class ensemble learning of imbalanced bidding fraud data. In Canadian AI, volume 11489 of Lecture Notes in Computer Science, pages 352–358. Springer.

Araújo, L. R. and Souza, J. F. (2011). Aumentando a transparência do governo por meio da transformação de dados governamentais abertos em dados ligados. RESI, 10(1).

Clarindo, J. P. et al. (2020). Qualisus: um dataset sobre dados da saúde pública no brasil. SBBD DSW, pages 418–428.

Costa, L., Reis, A., Bacha, C. A., Oliveira, G. P., Silva, M. O., Teixeira, M. C., Brandão, M. A., Lacerda, A., and Pappa, G. (2022). Alertas de fraude em licitações: Uma abordagem baseada em redes sociais. In Anais do XI Brazilian Workshop on Social Network Analysis and Mining, pages 37–48, Porto Alegre, RS, Brasil. SBC.

Gabardo, A. C. and Lopes, H. S. (2014). Using social network analysis to unveil cartels in public bids. In ENIC, pages 17–21. IEEE.

Lima, M. et al. (2020). Inferring about fraudulent collusion risk on brazilian public works contracts in official texts using a bi-lstm approach. In EMNLP, pages 1580–1588.

Lyra, M. S. et al. (2021). Characterization of the firm–firm public procurement co-bidding network from the State of Ceará (Brazil) municipalities. Appl. Network Sci., 6(1):1–10.

Mata, W. R. R. et al. (2019). JusBD: Um Banco de Dados para Obtenção de Informações do Poder Judiciário. pages 398–407.

Meera, S. and Geerthik, S. (2022). Natural language processing. Artificial Intelligent Techniques for Wireless Communication and Networking, pages 139–153.

Muniz, R. I. V. C. S. and Lóscio, B. F. (2018). Publicação de Dados Abertos Conectados Sobre os Transplantes Realizados no IMIP. In SBBD WTDBD, Rio de Janeiro, Brasil.

Oliveira, E. F. and Silveira, M. S. (2018). Open government data in brazil a systematic review of its uses and issues. In dg.o, pages 1–9.

Pereira, L. S. (2022). Caracterização da comunidade que utiliza dados abertos governamentais sobre a educação brasileira. Master’s thesis, Universidade Federal de Campina Grande, Campina Grande, Brasil.

Pereira, R. and Murai, F. (2021). Quão efetivas são redes neurais baseadas em grafos na detecção de fraude para dados em rede? In BraSNAM, pages 205–210. SBC.

Shimron, E. et al. (2022). Implicit data crimes: Machine learning bias arising from misuse of public data. the National Academy of Sciences, 119(13):e2117203119.

Silva, L. C. et al. (2020). Utilização de técnicas de mineração de dados para detectar possíveis relacionamentos entre empresas participantes de licitações nas forças armadas. Acanto em Revista, 7(7):85–85.

van Erven, G. C. G. et al. (2017). Detecting evidence of fraud in the brazilian government using graph databases. In WorldCIST, pages 464–473. Springer.

Velasco, R. B. et al. (2021). A decision support system for fraud detection in public procurement. Int. Trans. Oper. Res., 28(1):27–47.
Publicado
19/09/2022
SILVA, Mariana O. et al. LiPSet: Um conjunto de Dados com Documentos Rotulados de Licitações Públicas. In: DATASET SHOWCASE WORKSHOP (DSW), 4. , 2022, Búzios. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 13-24. DOI: https://doi.org/10.5753/dsw.2022.224925.