Aplicação do descritor HOG e classificador SVM no reconhecimento de poses humanas em imagens de profundidade
Resumo
O reconhecimento automático de gestos e poses humanas por meio de aprendizado de máquina é um desafio significativo. O presente trabalho propõe uma metologia simples para reconhecimento de poses humanas exclusivamente através de imagens de profundidade. O método consiste de remoção de plano de fundo, extração de características de poses via histogramas de gradientes orientados (HOG) e classificação via máquina de vetores de suporte (SVM). A sequência de processamento proposta foi validada em um teste com cinco classes de poses humanas, no qual foi obtida uma taxa de acerto de 95.6%.
Referências
Biswas, K. and Basu, S. K. (2011). Gesture recognition using microsoft kinect.
Boutella, E., Hadid, A., Bengherabi, M., and Ait-Aoudia, S. (2015). On the use of kinect depth data for identity, gender and ethnicity classification from facil images. ELSEVIER.
Bragatto, T. A. C., Ruas, G., and Lamar, M. (2016). Uma comparação entre redes neurais artificiais e máquinas de vetores de suporte para reconhecimento de posturas manuais em tempo-real. pages 1–6.
Gonzalez, R. and Woods, R. (2010). Processamento Digital de Imagens. Pearson Prentice Hall, S˜ao Paulo, 3 edition.
Huang, d., Shan, C., Ardabilian, M.,Wang, Y., and Chen, L. (2011). Local binary patterns and its application to facial image analysis: A survey. 41:765–781.
Kannala, J. and Rahtu, E. (2012). Bsif: Binarized statistical image features. In Proceedings of the 21st International Conference on Pattern Recognition (ICPR2012), pages 1363–1366.
Kittipat’s (2013). libsvm for matlab. Disponível em: https://sites.google.com/site/kittipat/libsvm_matlab Acessado: 09 de Maio de 2017.
Lima, V., Branco, K., and Colturato, A. (2014). Reconhecimento De Padr˜oes Em Imagens De Plantas De Eucalipto Obtida Por Um Veículo Aéreo N˜ao Tripulado (VANT), volume 22. Simpósio Internacional de Iniciação Científica e Tecnológica da USP.
Morais, V. P. and Vieira, C. (2013). MATLAB: curso completo. FCA.
Nanni, L., Brahnam, S., and Lumini, A. (2012). Local phase quantization descriptor for improving shape retrieval/classification. 33:2254–2260.
Ng, R. (2016). Support vector machines - svms. Disponível em: http://www.ritchieng.com/machine-learning-svms-support-vector-machines/ Acessado: 15 de Novembro de 2017.
Rios, A. (2012). Libras - alfabeto e números. Disponível em: http://www.ebah.com.br/content/ABAAAA9skAJ/libras-alfabeto-numeros Acessado: 25 de Outubro de 2017.
Russell, S. and Norvig, P. (2010). Artificial Intelligence: A Modern Approach. Prentice Hall Series in Artifi. Prentice Hall.
Szeliski, R. (2010). Computer Vision: Algorithms and Applications. Texts in Computer Science. Springer London.
Triggs, B. and Dalal, N. (2005). Histograms of Oriented Gradients for Human Detection. Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05).