Classificação de imagens de ideogramas Kuzushiji com Redes Neurais Convolucionais

  • Lucimara Martins UNESP
  • Mario Júnior Universidade Estadual Paulista "Júlio de Mesquita Filho"
  • Adriane Serapião Universidade Estadual Paulista "Júlio de Mesquita Filho"

Resumo


Este artigo avalia algoritmos de aprendizado de máquina para a classificação de um conjunto de imagens de ideogramas japoneses, em estilo cursivo Kuzushiji. Atualmente tal estilo está em desuso no Japão mas foi amplamente utilizado por séculos em manuscritos. Por isso há um desafio para construir um modelo que transcreva automaticamente os antigos ideogramas Kuzushij para o hiragana a fim de recuperar documentos históricos. Este artigo propõe uma contribuição para a identificação de tais ideogramas Kuzushiji em seus diferentes estilos cursivos, usando Redes Neurais Convolucionais. Os resultados foram comparados com um trabalho de base e com outros algoritmos de classificação de Aprendizado de Máquina, obtendo resultados melhores que o trabalho de base.

Palavras-chave: Aprendizado de máquina, Kuzushiji, Redes Neurais Convolucionais, K Vizinhos mais Próximos, Análise de Componentes Principais

Referências

Chollet, F. (2015). Keras. https://github.com/fchollet/keras.

Ciresan, D., Meier, U., and Schmidhuber, J. (2012). Multi-column deep neural networks for image classification. In Proceedings of the 25th IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2012), pages 3642–3649.

Clanuwat, T., Bober-Irizar, M., Kitamoto, A., Yamamoto, K., Lamb, A., and Ha, D. (2018). Deep learning for classical japanese literature. CoRR, abs/1812.01718.

Fix, E., Hodges, J., and of Aviation Medicine, U. S. (1951). Discriminatory Analysis: Nonparametric Discrimination, Consistency Properties. Number v. 1-2 in Discriminatory Analysis: Nonparametric Discrimination, Consistency Properties. USAF School of Aviation Medicine.

Goodfellow, I. J., Bengio, Y., and Courville, A. (2016). Deep Learning. MIT Press, Cambridge, MA, USA.

Hashimoto, Y., Iikura, Y., Hisada, Y., Kang, S., Arisawa, T., and Kobayashi-Better, D. (2017). The kuzushiji project: Developing a mobile learning application for reading early modern japanese texts. Digital Humanities Quarterly, 11(1):1–13.

Haykin, S. S. (2009). Neural networks and learning machines. Pearson Education, Upper Saddle River, NJ, third edition.

He, K., Zhang, X., Ren, S., and Sun, J. (2016). Deep residual learning for image recognition. In The IEEE Conference on Computer Vision and Pattern Recognition (CVPR).

Lecun, Y., Bottou, L., Bengio, Y., and Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11):2278–2324.

Pearson, K. (1901). On lines and planes of closest fit to system of points in space. Phil. Mag. 2, 6:559–572.

Rawat, W. and Wang, Z. (2017). Deep convolutional neural networks for image classification: A comprehensive review. Neural Comput., 29(9):2352–2449.

Tan, P.-N., Steinbach, M., and Kumar, V. (2016). Introduction to Data Mining, (Second Edition). Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.

NA Embora a CNN tenha obtido os melhores resultados nos experimentos e tenha sido também melhor que sua equivalente no trabalho de referência, seus resultados foram ainda inferiores aos dos modelos usando PreActResNet-18 na referência. Tais modelos, além de possuı́rem mais camadas, têm unidades de pré-ativação que proporcionam efeito de regularização durante o treinamento. Para trabalhos futuros, propõe-se inserir mecanismos de regularização L2 na CNN e experimentar diferentes números de unidades escondidas nas camadas densas, assim como explorar arquiteturas de redes resilientes.

Chollet, F. (2015). Keras. https://github.com/fchollet/keras.

Ciresan, D., Meier, U., and Schmidhuber, J. (2012). Multi-column deep neural networks for image classification. In Proceedings of the 25th IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2012), pages 3642–3649.

Clanuwat, T., Bober-Irizar, M., Kitamoto, A., Yamamoto, K., Lamb, A., and Ha, D. (2018). Deep learning for classical japanese literature. CoRR, abs/1812.01718.

Fix, E., Hodges, J., and of Aviation Medicine, U. S. (1951). Discriminatory Analysis: Nonparametric Discrimination, Consistency Properties. Number v. 1-2 in Discriminatory Analysis: Nonparametric Discrimination, Consistency Properties. USAF School of Aviation Medicine.

Goodfellow, I. J., Bengio, Y., and Courville, A. (2016). Deep Learning. MIT Press, Cambridge, MA, USA.

Hashimoto, Y., Iikura, Y., Hisada, Y., Kang, S., Arisawa, T., and Kobayashi-Better, D. (2017). The kuzushiji project: Developing a mobile learning application for reading early modern japanese texts. Digital Humanities Quarterly, 11(1):1–13.

Haykin, S. S. (2009). Neural networks and learning machines. Pearson Education, Upper Saddle River, NJ, third edition.

He, K., Zhang, X., Ren, S., and Sun, J. (2016). Deep residual learning for image recognition. In The IEEE Conference on Computer Vision and Pattern Recognition (CVPR).

Lecun, Y., Bottou, L., Bengio, Y., and Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11):2278–2324.

Pearson, K. (1901). On lines and planes of closest fit to system of points in space. Phil. Mag. 2, 6:559–572.

Rawat, W. and Wang, Z. (2017). Deep convolutional neural networks for image classification: A comprehensive review. Neural Comput., 29(9):2352–2449.

Tan, P.-N., Steinbach, M., and Kumar, V. (2016). Introduction to Data Mining, (Second Edition). Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA.
Publicado
15/10/2019
Como Citar

Selecione um Formato
MARTINS, Lucimara; JÚNIOR, Mario; SERAPIÃO, Adriane. Classificação de imagens de ideogramas Kuzushiji com Redes Neurais Convolucionais. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 16. , 2019, Salvador. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 309-320. DOI: https://doi.org/10.5753/eniac.2019.9293.