Machine Learning Models for Identification of Goods from the Item Description on the Electronic Tax Invoice
Abstract
One of the issues that impose limitations on tax actions in Notas Fiscais Eletrônicas is to be able to identify the goods from the item description field, both for the variety of content, since it is free to fill, and for the volume of information generated. This article presents three Machine Learning models applied in processing this field: Decision Tree, Neural Network and KNN. The experiments demonstrated that the Neural Network delivered the best accuracy and the lowest cost of prediction time. The data used are from the SEFAZ/MA. The collected results can guide solutions for detecting under-invoicing, improper exemptions, correction of the inflation lag of the tax tariff table, etc.
References
Jatobá, A., Moura, D., Martins, I., Ramos, H., Aquino, A. (2021) CALT: Uma Ferramenta Automática para Cobrança do ICMS em Operações Interestaduais. In Anais do IX Workshop de Computação Aplicada em Governo Eletrônico.
Galdino, G., Silveira, M. R., Fonseca Neto, R. (2004). Uma rede neural artificial de múltiplas camadas aplicadas ao combate à sonegação fiscal de icms. In Anais do XXXVI Simpósio Brasileiro de Pesquisa Operacional (SBPO).
Carmo, M., Boldt, F., Komati, K. (2019). Previsão de receitas de icms do estado do espírito santo através de seleção de características em cascata e técnicas de aprendizado de máquina. In Anais do XVI Encontro Nacional de Inteligência Artificial e Computacional, pages 118–129, Porto Alegre, RS, Brasil.
Madeira, R. d. O. C. (2015). Aplicação de técnicas de mineração de texto na detecção de discrepâncias em documentos fiscais. Dissertação (mestrado) – Fundação Getúlio Vargas, Escola de Matemática Aplicada.
MOC (2020). Manual de Orientação ao Contribuinte. Disponível em: [link]. [Acesso em 24/02/2022].
Receita Federal do Brasil, (2021). Download NCM Nomenclatura Comum do MERCOSUL. Disponível em [link]. [Acesso em 10/03/2022].
Chollet, F. (2017). Deep Learning with Python, Manning 1st Edition Developer Guides Keras. Disponível em https://keras.io/guides/. Acesso em 03/03/2022
Rokach, L. and Maimon, O. (2014), Data Mining With Decision Trees: Theory And Applications, World Scientific, 2nd edition.
Grus, J. (2016), Data Science do Zero, Alta Books, 1ª Edição. User Guide Scikit Learn. Disponível em https://scikit-learn.org/stable/user_guide.html. Acesso em 08/03/2022.
Loy, J. (2019), Neural Networks Projects with Python, Packt Publishing, 1st edition.
Bhasin, H. (2020) Machine Learning for Beginners, BPB Publications, 1st edition.
Bonaccorso, G. (2019), Hands-On Unsupervised Learning with Python, Packt Publishing, 1st Edition.
Johnston, B. and Mathur, I. (2019), Applied Supervised Learning with Python, Packt Publishing, 1st Edition.
