Deep Learning para Geração Automática de Legenda de Imagem

  • Maynara Scoparo Universidade do Estado de São Paulo
  • Adriane Serapião Universidade do Estado de São Paulo


A geração automática de legenda de imagem é uma tarefa que consiste em decifrar uma imagem e descrevê-la em frases em linguagem natural. Combina Processamento de Linguagem Natural e Visão Computacional para gerar legendas. Recentemente, os métodos de Deep Learning estão obtendo resultados muito promissores para o problema de geração de legendas. O presente trabalho propôs, com base no modelo NIC (Neural Image Caption), uma combinação de redes neurais convolucionais sobre imagens e rede neural recorrente sobre frases, alinhando-as a um objetivo estruturado de criar a descrição textual das imagens. Os resultados mostraram que o modelo neural proposto foi capaz de aprender o modelo da linguagem sobre o conteúdo da imagem, produzindo descrições precisas na maioria das imagens.

Palavras-chave: Deep Learning, geração automática de legenda de imagem, Processamento de Linguagem Natural, Visão Computacional


SCOPARO, Maynara; SERAPIÃO, Adriane. Deep Learning para Geração Automática de Legenda de Imagem. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 16. , 2019, Salvador. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 551-562. ISSN 2763-9061. DOI: