Detecção de Documentos Acadêmicos Falsificados: Uma Solução Baseada em Aprendizado de Máquina
Resumo
Nos últimos anos, no Brasil, o crescimento de ingressantes, de formandos e de instituições de ensino superior intensificou os desafios relacionados à validação de certificados acadêmicos, já que a verificação é majoritariamente manual, sujeita a erros e a aceitação de fraudes. Este trabalho propõe um protótipo híbrido que combina análise multimodal, clustering, detecção de anomalias e classificação por grau de legitimidade para detectar documentos acadêmicos falsificados. Ao integrar o protótipo à Rede de Rastreabilidade de Dados da Educação Superior – iniciativa oficial para o acompanhamento de registros e comprovações acadêmicas –, documentos podem ser validados automaticamente antes do registro em sua rede distribuída, aumentando a segurança e a confiabilidade do credenciamento.Referências
Alameri, M., Mahmood, B., Ciylan, B., and Amged, A. (2023). Unsupervised forgery detection of documents: A network-inspired approach. Electronics, 12.
Boonkrong, S. (2024). Design of an academic document forgery detection system. International Journal of Information Technology, pages 1–13.
Dias, P. and Leal, A. (2022). Sites vendem diploma de curso superior para quem sequer pisou em sala de aula: ’documentação 100% original, emitida de dentro da universidade’, diz atendente. O Globo. Disponível em: [link]. Acesso em: 05 abr. 2025.
INEP (2024). Censo da educação superior 2023: notas estatísticas.
Jain, R. and Wigington, C. (2019). Multimodal document image classification. In 2019 International Conference on Document Analysis and Recognition (ICDAR), pages 71–77.
Jaiswal, G., Sharma, A., and Yadav, S. (2022). Deep feature extraction for document forgery detection with convolutional autoencoders. Computers & Electrical Engineering, 99:107770.
James, H., Gupta, O., and Raviv, D. (2020). Ocr graph features for manipulation detection in documents. arXiv preprint arXiv:2009.05158.
Mohammed, S., Nwobodo, L., and Ekene, N. (2024). Certificate fraud verification model using clustered-based classification approach. Explorematics Journal of Innovative Engineering and Technology, 5(1):60–72.
Palma, L. M., Vigil, M. A. G., Pereira, F. L., and Martina, J. E. (2019). Blockchain and smart contracts for higher education registry in brazil. International Journal of Network Management, 29.
RNP (2023). Blockchain da jornada acadêmica. Youtube. Disponível em: [link]. Acesso em: 13 mai. 2025.
Boonkrong, S. (2024). Design of an academic document forgery detection system. International Journal of Information Technology, pages 1–13.
Dias, P. and Leal, A. (2022). Sites vendem diploma de curso superior para quem sequer pisou em sala de aula: ’documentação 100% original, emitida de dentro da universidade’, diz atendente. O Globo. Disponível em: [link]. Acesso em: 05 abr. 2025.
INEP (2024). Censo da educação superior 2023: notas estatísticas.
Jain, R. and Wigington, C. (2019). Multimodal document image classification. In 2019 International Conference on Document Analysis and Recognition (ICDAR), pages 71–77.
Jaiswal, G., Sharma, A., and Yadav, S. (2022). Deep feature extraction for document forgery detection with convolutional autoencoders. Computers & Electrical Engineering, 99:107770.
James, H., Gupta, O., and Raviv, D. (2020). Ocr graph features for manipulation detection in documents. arXiv preprint arXiv:2009.05158.
Mohammed, S., Nwobodo, L., and Ekene, N. (2024). Certificate fraud verification model using clustered-based classification approach. Explorematics Journal of Innovative Engineering and Technology, 5(1):60–72.
Palma, L. M., Vigil, M. A. G., Pereira, F. L., and Martina, J. E. (2019). Blockchain and smart contracts for higher education registry in brazil. International Journal of Network Management, 29.
RNP (2023). Blockchain da jornada acadêmica. Youtube. Disponível em: [link]. Acesso em: 13 mai. 2025.
Publicado
12/11/2025
Como Citar
RANSOLIN, Samuel M.; INOCÊNCIO, Giovana N.; MARTINA, Jean E..
Detecção de Documentos Acadêmicos Falsificados: Uma Solução Baseada em Aprendizado de Máquina. In: ESCOLA REGIONAL DE APRENDIZADO DE MÁQUINA E INTELIGÊNCIA ARTIFICIAL DA REGIÃO SUL (ERAMIA-RS), 1. , 2025, Porto Alegre/RS.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 264-267.
DOI: https://doi.org/10.5753/eramiars.2025.16635.