Uso de Reconhecimento Óptico de Caracteres para Extração de Textos em Imagens de Redações

  • Filipe A. Sampaio UFPI
  • Raimundo S. Moura UFPI
  • Kelson R. T. Aires UFPI

Resumo


Avaliação Automática de Redação é uma tarefa da área de Processamento de Linguagem Natural, cujo objetivo é avaliar e pontuar textos em prosa escrita. Uma das principais dificuldades desta tarefa é a deficiência de conjuntos de dados de redações anotadas com o valor obtido em cada competência. Assim, este trabalho propõe uma solução eficaz para capturar as redações escritas por alunos, através de técnicas de visão computacional e reconhecimento óptico de caracteres. Esse trabalho segmenta palavras da imagem do texto da redação e processa cada palavra, reconhecendo então o texto de cada imagem. Ao final, ordena todas as palavras na sequência correta da leitura, obtendo desempenho moderado.

Palavras-chave: Visão Computacional, Reconhecimento óptico de Caractere, CRNN

Referências

Axler, G. and Wolf, L. (2018). Toward a dataset-agnostic word segmentation method. In 2018 25th IEEE International Conference on Image Processing (ICIP), pages 2635–2639. IEEE.

Barros, S. C. B. (2019). Estudo do desempenho de candidatos à UFRN na prova de redação do Enem no período de 2013 a 2016. Dissertação de mestrado, Brasil.

INEP, E. (2021). Painéis Enem. [link].

Marinho, J. C., Anchieta, R. T., and Moura, R. S. (2021). Essay-br: a Brazilian corpus of essays. arXiv preprint arXiv:2105.09081.

Marinho, J. C., Cordeiro, F., Anchieta, R. T., and Moura, R. S. (2022). Automated essay scoring: An approach based on Enem competencies. In Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional, pages 49–60. SBC.

Marti, U.-V. and Bunke, H. (2002). The IAM-database: an English sentence database for offline handwriting recognition. International Journal on Document Analysis and Recognition, 5:39–46.

Parthiban, R., Ezhilarasi, R., and Saravanan, D. (2020). Optical character recognition for English handwritten text using recurrent neural network. In 2020 International Conference on System, Computation, Automation and Networking (ICSCAN), pages 1–5. IEEE.

Scheidl, H., Fiel, S., and Sablatnig, R. (2018). Word beam search: A connectionist temporal classification decoding algorithm. In 2018 16th International Conference on Frontiers in Handwriting Recognition (ICFHR), pages 253–258. IEEE.

Zhou, X., Yao, C., Wen, H., Wang, Y., Zhou, S., He, W., and Liang, J. (2017). EAST: an efficient and accurate scene text detector. In Proceedings of the IEEE conference on Computer Vision and Pattern Recognition, pages 5551–5560.
Publicado
19/10/2023
SAMPAIO, Filipe A.; MOURA, Raimundo S.; AIRES, Kelson R. T.. Uso de Reconhecimento Óptico de Caracteres para Extração de Textos em Imagens de Redações. In: ENCONTRO UNIFICADO DE COMPUTAÇÃO DO PIAUÍ (ENUCOMPI), 16. , 2023, Piripiri/PI. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 57-64. DOI: https://doi.org/10.5753/enucompi.2023.26617.