Extração de elementos textuais em imagens capturadas por  smartphones​ : análise da relação entre as características das  imagens e a eficácia da extração 

  • Daniel M. Kuhn​
  • Cristiano R. Cervi​
  • Edimar Manica​

Resumo


Softwares  de  reconhecimento  óptico  de  caracteres  têm  como  propósito  converter  elementos  textuais  de  documentos  em  texto  editável  e  pesquisável.  Essa  tarefa  apresenta  desafios  específicos  quando  submetida  a  imagens  capturadas  por  câmeras  de  smartphones.  Este  trabalho  analisa  experimentalmente  a  relação  entre  a  eficácia  de  extração  em  imagens  capturadas  por  smartphones  e  suas  características.  Os  experimentos  demonstram  que  imagens  com texto curvilíneo e variação de iluminação não  comprometem  substancialmente  a  eficácia  de  extração,  ao  instante  que  imagens  com  textos  inclinados,  bem  como  imagens  que  possuem  caracteres  pouco nítidos, apresentam os menores índices de extração.  A análise de Big Data é um aspecto chave da sociedade moderna uma vez que permite  criar conhecimento a partir de dados. Essa análise traz o conhecimento para o indivíduo  de uma forma direta e facilitada permitindo a emancipação das pessoas e as habilitando  a  agirem  e  tomarem  decisões  com  mais  embasamento  [Manica, Dorneles and Galante  2017].  Problemas  de  heterogeneidade,  escalabilidade,  complexidade  e  privacidade  impedem o progresso de todos os estágios do ​pipeline que extrai valor a partir de dados  [​Labrinidis  and  Jagadish  2012​].  Nesse  contexto,  os  problemas  iniciam  durante  a  aquisição  de  dados  porque  muitos  dados  não  estão  nativamente  em  um  formato  estruturado  e  estruturar  tal conteúdo para análise futura é o principal desafio [​Agrawal  et al​ 2012]. 
Publicado
11/04/2018
KUHN​, Daniel M.; CERVI​, Cristiano R.; MANICA​, Edimar. Extração de elementos textuais em imagens capturadas por  smartphones​ : análise da relação entre as características das  imagens e a eficácia da extração . In: ESCOLA REGIONAL DE BANCO DE DADOS (ERBD), 14. , 2018, Rio Grande. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . ISSN 2595-413X.