Um Sistema de Validação de Imagens de Documentos Pessoais Utilizando Detecção de Objetos

  • Lucas S. Fernandes UFC
  • Francisco Igor da Silva Lima UFC
  • Tácio Soares Aguiar UFC
  • Rodrigo da Silva Freitas UFC
  • Gabriel Campos de Oliveira UFC
  • José Gilvan Rodrigues Maia UFC
  • Paulo Antonio Leal Rego UFC

Resumo


A análise e o reconhecimento de documentos de identidade baseados em imagens têm sido usados em várias aplicações e contextos, trazendo benefícios para a sociedade. Muitos processos são realizados manualmente e se beneficiariam da automatização da validação de informação contida nesses documentos. Este trabalho apresenta um novo sistema automático de validação de documentos pessoais. Ele extrai e reconhece informações relevantes usando um modelo de detecção de objetos de última geração e reconhecimento óptico de caracteres. Utilizando certidões de nascimento e casamento como objeto de estudo, um conjunto de dados privado de documentos reais é usado para treinar a rede e testar o sistema. O reconhecimento de informações atingiu 75% de precisão para reconhecimento de nomes, 82% para matrículas e 65% para ambos juntos. Considerando pelo menos 80% de similaridade, nosso método alcançou 94% de precisão para o reconhecimento de nomes, 93% para o registro e 91% para ambos. Portanto, esses resultados indicam que o sistema proposto é promissor.

Referências

Bulatov, K., Bezmaternykh, P., Nikolaev, D., and Arlazarov, V. (2022). Towards a unified framework for identity documents analysis and recognition. Computer Optics, 46(3):436–454.

Castelblanco, A., Solano, J., Lopez, C., Rivera, E., Tengana, L., and Ochoa, M. (2020). Machine learning techniques for identity document verification in uncontrolled environments: A case study. In Mexican Conference on Pattern Recognition, pages 271–281. Springer.

LeCun, Y., Bengio, Y., and Hinton, G. (2015). Deep learning. nature, 521(7553):436.

Lopes Junior, C. A., das Neves Junior, R. B., Bezerra, B. L., Toselli, A. H., and Impedovo, D. (2021). Icdar 2021 competition on components segmentation task of document photos. In Document Analysis and Recognition–ICDAR 2021: 16th International Conference, Lausanne, Switzerland, September 5–10, 2021, Proceedings, Part IV 16, pages 678–692. Springer.

Polevoy, D. V., Sigareva, I. V., Ershova, D. M., Arlazarov, V. V., Nikolaev, D. P., Ming, Z., Luqman, M. M., and Burie, J.-C. (2022). Document liveness challenge dataset (dlc-2021). Journal of Imaging, 8(7):181.

Russakovsky, O., Li, L.-J., and Fei-Fei, L. (2015). Best of both worlds: human-machine collaboration for object annotation. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 2121–2131.

Smith, R. (2007). An overview of the tesseract ocr engine. In Ninth international conference on document analysis and recognition (ICDAR 2007), volume 2, pages 629–633. IEEE.

Tang, Y. Y., Suen, C. Y., Yan, C. D., and Cheriet, M. (1991). Documents analysis and understanding: a brief survey.

Wu, X., Xu, J., Wang, J., Li, Y., Li, W., and Guo, Y. (2019). Identity authentication on mobile devices using face verification and id image recognition. Procedia Computer Science, 162:932–939.

Xu, J. and Wu, X. (2018). A system to localize and recognize texts in oriented id card images. In 2018 IEEE International Conference on Progress in Informatics and Computing (PIC), pages 149–153. IEEE.

Yu, F., Seff, A., Zhang, Y., Song, S., Funkhouser, T., and Xiao, J. (2015). Lsun: Construction of a large-scale image dataset using deep learning with humans in the loop. arXiv preprint arXiv:1506.03365.

Álysson Soares, das Neves Junior, R., and Bezerra, B. (2020). Bid dataset: a challenge dataset for document processing tasks. In Anais Estendidos do XXXIII Conference on Graphics, Patterns and Images, pages 143–146, Porto Alegre, RS, Brasil. SBC.
Publicado
23/11/2023
FERNANDES, Lucas S.; LIMA, Francisco Igor da Silva; AGUIAR, Tácio Soares; FREITAS, Rodrigo da Silva; DE OLIVEIRA, Gabriel Campos; MAIA, José Gilvan Rodrigues; REGO, Paulo Antonio Leal. Um Sistema de Validação de Imagens de Documentos Pessoais Utilizando Detecção de Objetos. In: ESCOLA REGIONAL DE COMPUTAÇÃO DO CEARÁ, MARANHÃO E PIAUÍ (ERCEMAPI), 11. , 2023, Aracati/CE. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 21-30. DOI: https://doi.org/10.5753/ercemapi.2023.236261.