Comparação de APIs de OCR para Reconhecimento de Dígitos em Imagens de Mostrador de Sete Segmentos

  • Jonathan R. da Silva IFES
  • Leandro C. Resendo IFES
  • Jefferson O. Andrade IFES
  • Karin S. Komati IFES

Resumo


As plataformas de computação em nuvem tornam acessível a tecnologia de reconhecimento de texto. Entretanto, a escolha da plataforma mais adequada para uma determinada aplicação nem sempre é evidente. Este trabalho avaliou cinco soluções diferentes para reconhecimento de texto: AWS Rekognition, Microsoft Azure, Cloudmersive, Google OCR e OCRSpace. Foi utilizada uma base de dados de imagens de mostradores de sete segmentos em medidores de energia elétrica, a “YUVA EB Dataset”. Não houve pré-processamento para a melhoria da qualidade da imagem, para melhoria de iluminação ou para eliminação de ruídos. O Google Cloud apresentou melhores resultados acertando 100 resultados das 169 imagens de entrada, com acurácia de 86,5%considerando os 965 dígitos. Os resultados obtidos sugerem que as soluções oferecidas comercialmente não são adequadas para uso em produção sem uma etapa anterior de pré-processamento das imagens.
Palavras-chave: Reconhecimento de digitos, Computação em nuvem, Mostrador de sete segmentos

Referências

Anda, F., Lillis, D., Le-Khac, N., and Scanlon, M. (2018). Evaluating automated facial age estimation techniques for digital forensics. In Proceedings of 2018 IEEE Securityand Privacy Workshops (SPW), pages 129–139. IEEE.

Bonačić, I., Herman, T., Krznar, T., Mangić, E., Molnar, G., & Čupić, (2015). Optical character recognition of seven-segment display digits using neural networks. In 32st International Convention on Information and Communication Technology, Electronics and Microelectronics, volume 3.

Finnegan, E., Villarroel, M., Velardo, C., and Tarassenko, L. (2019). Automated method for detecting and reading seven-segment digits from images of blood glucose metres and blood pressure monitors. Journal of Medical Engineering & Technology, 43(6):341–355.

Kanagarathinam, K. and Sekar, K. (2019). Text detection and recognition in raw image dataset of seven segment digital energy meter display. Energy Reports, 5:842–852.

Torres, W., van den Brand, M. G., and Serebrenik, A. (2020). Suitability of optical character recognition (ocr) for multi-domain model management. In International Conference on Systems Modelling and Management, pages 149–162. Springer.
Publicado
18/07/2021
SILVA, Jonathan R. da; RESENDO, Leandro C.; ANDRADE, Jefferson O.; KOMATI, Karin S.. Comparação de APIs de OCR para Reconhecimento de Dígitos em Imagens de Mostrador de Sete Segmentos. In: ENCONTRO NACIONAL DE COMPUTAÇÃO DOS INSTITUTOS FEDERAIS (ENCOMPIF), 8. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 33-40. ISSN 2763-8766. DOI: https://doi.org/10.5753/encompif.2021.15948.