Um Sistema de Validação de Imagens de Documentos Pessoais Utilizando Detecção de Objetos
Resumo
A análise e o reconhecimento de documentos de identidade baseados em imagens têm sido usados em várias aplicações e contextos, trazendo benefícios para a sociedade. Muitos processos são realizados manualmente e se beneficiariam da automatização da validação de informação contida nesses documentos. Este trabalho apresenta um novo sistema automático de validação de documentos pessoais. Ele extrai e reconhece informações relevantes usando um modelo de detecção de objetos de última geração e reconhecimento óptico de caracteres. Utilizando certidões de nascimento e casamento como objeto de estudo, um conjunto de dados privado de documentos reais é usado para treinar a rede e testar o sistema. O reconhecimento de informações atingiu 75% de precisão para reconhecimento de nomes, 82% para matrículas e 65% para ambos juntos. Considerando pelo menos 80% de similaridade, nosso método alcançou 94% de precisão para o reconhecimento de nomes, 93% para o registro e 91% para ambos. Portanto, esses resultados indicam que o sistema proposto é promissor.
Referências
Castelblanco, A., Solano, J., Lopez, C., Rivera, E., Tengana, L., and Ochoa, M. (2020). Machine learning techniques for identity document verification in uncontrolled environments: A case study. In Mexican Conference on Pattern Recognition, pages 271–281. Springer.
LeCun, Y., Bengio, Y., and Hinton, G. (2015). Deep learning. nature, 521(7553):436.
Lopes Junior, C. A., das Neves Junior, R. B., Bezerra, B. L., Toselli, A. H., and Impedovo, D. (2021). Icdar 2021 competition on components segmentation task of document photos. In Document Analysis and Recognition–ICDAR 2021: 16th International Conference, Lausanne, Switzerland, September 5–10, 2021, Proceedings, Part IV 16, pages 678–692. Springer.
Polevoy, D. V., Sigareva, I. V., Ershova, D. M., Arlazarov, V. V., Nikolaev, D. P., Ming, Z., Luqman, M. M., and Burie, J.-C. (2022). Document liveness challenge dataset (dlc-2021). Journal of Imaging, 8(7):181.
Russakovsky, O., Li, L.-J., and Fei-Fei, L. (2015). Best of both worlds: human-machine collaboration for object annotation. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 2121–2131.
Smith, R. (2007). An overview of the tesseract ocr engine. In Ninth international conference on document analysis and recognition (ICDAR 2007), volume 2, pages 629–633. IEEE.
Tang, Y. Y., Suen, C. Y., Yan, C. D., and Cheriet, M. (1991). Documents analysis and understanding: a brief survey.
Wu, X., Xu, J., Wang, J., Li, Y., Li, W., and Guo, Y. (2019). Identity authentication on mobile devices using face verification and id image recognition. Procedia Computer Science, 162:932–939.
Xu, J. and Wu, X. (2018). A system to localize and recognize texts in oriented id card images. In 2018 IEEE International Conference on Progress in Informatics and Computing (PIC), pages 149–153. IEEE.
Yu, F., Seff, A., Zhang, Y., Song, S., Funkhouser, T., and Xiao, J. (2015). Lsun: Construction of a large-scale image dataset using deep learning with humans in the loop. arXiv preprint arXiv:1506.03365.
Álysson Soares, das Neves Junior, R., and Bezerra, B. (2020). Bid dataset: a challenge dataset for document processing tasks. In Anais Estendidos do XXXIII Conference on Graphics, Patterns and Images, pages 143–146, Porto Alegre, RS, Brasil. SBC.