Detecção de Fraudes em Licitações Públicas: Uma Comparação de Modelos de Detecção de Anomalias
Resumo
A detecção de anomalias em conjuntos de dados é de grande relevância para a área contábil onde registros irregulares podem ser considerados indícios de fraude. Este tipo de análise pode ser usado para mitigar riscos e evitar perdas financeiras, sobretudo no setor público. Este trabalho tem como objetivo a detecção de anomalias em dados de notas fiscais reais de licitações do setor público brasileiro de forma autônoma, realizando uma análise comparativa entre os algoritmos Local Outlier Factor, Isolation Forest e Self-Organizing Maps em relação à sua capacidade de localizar possíveis casos de fraude. Os resultados mostraram que o Isolation Forest foi mais efetivo em detectar fraudes em comparação aos demais algoritmos.
Referências
Brasil (2021). Lei federal nº 14.133/21 art. 90, de 1 de abril de 1993. Diário Oficial [da] República Federativa do Brasil. Acessado em: 25 Outubro 2023.
Breunig, M., Kriegel, H.-P., Ng, R., and Sander, J. (2000). Lof: Identifying density-based local outliers. SIGMOD ’00: Proceedings of the 2000 ACM SIGMOD international conference on Management of data. Acessado em: 15 Outubro 2023.
Brzezinska, A. and Horyn, C. (2022). Self-organizing map algorithm as a tool for outlier detection. Procedia Computer Science. Acessado em: 27 Maio 2023.
Chandola, V., Banerjee, A., and Kumar, V. (2009). Anomaly detection: A survey. ACM Computing Surveys, 41(3). Acessado em: 27 Maio 2023.
Gomes, Y. (2017). Fraude em licitação no regime militar de 1964. Anais do IV Simpósio de História do Direito. Acessado em: 03 Junho 2023.
Hamelers, L. (2021). Detecting and explaining potential financial fraud cases in invoice data with machine learning. University of Twente. Acessado em: 27 Maio 2023.
Huang, S.-Y., Tsaih, R.-H., and Yu, F. (2014). Topological pattern discovery and feature extraction for fraudulent financial reporting. Expert Systems with Applications. Acessado em: 27 Maio 2023.
Liu, F., Ting, K., and Zhou, Z.-H. (2008). Isolation forest. 2008 Eighth IEEE International Conference on Data Mining. Acessado em: 27 Maio 2023.
Lopes, A., Raupp, A., Magro, R., and signor, R. (2021). O superfaturamento está definido na lei nº 14.133/2021, e agora? Acessado em: 15 Outubro 2023.
Oliveira, C. (2022). Governo bolsonaro: possíveis fraudes durante pandemia de covid-19 somam r$ 2 bilhões: Transparência brasil analisou 248 compras e contratações de serviços firmadas entre fevereiro de 2020 e outubro de 2022. Acessado em: 04 maio 2023.
Paula, E., Ladeira, M., Carvalho, R., and Marzagão, T. (2016). Deep learning anomaly detection as support fraud investigation in brazilian exports and anti-money laundering. 2016 15th IEEE International Conference on Machine Learning and Applications (ICMLA). Acessado em: 27 Maio 2023.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12:2825–2830.
Puente, B. and Ameida, P. (2021). Brasil pode perder mais de r$ 20 bilhões por ano com desvios na saúde. cnn brasil, rio de janeiro. 2021. Acessado em: 04 maio 2023.
Schwindt, C. and Corazza, H. (2008). Princípios Fundamentais e Normas Brasileiras de Contabilidade. CFC, Brasília.
Shan, Y., Murray, D., and Sutinen, A. (2009). Discovering inappropriate billings with local density based outlier detection method. AusDM ’09: Proceedings of the Eighth Australasian Data Mining Conference Volume 101. Acessado em: 15 Outubro 2023.
Vettigli, G. (2018). Minisom: minimalistic and numpy-based implementation of the self organizing map. Acessado em: 15 Outubro 2023.