Uma Ferramenta para Construção de Conjuntos de Dados de Referência para Sistemas de Análise de Gestos Baseados em Imagens

  • Priscilla K. Wagner USP
  • Guilherme O. Borges USP
  • Renata C. B. Madeo USP
  • Sarajane M. Peres USP

Resumo


Este artigo apresenta uma ferramenta para construção de conjuntos de dados de referência para aferição de sistemas de análise de gestos baseados em imagens, visando tarefas de segmentação de objetos de interesse e reconhecimento de padrões. A principal motivação deste projeto e contribuir para que as várias iniciativas de desenvolvimento de tais sistemas possam ser eficazmente comparadas. A ferramenta apresenta como diferencial funcionalidades dedicadas a preparar conjuntos de vídeos, frames e vetores de características, organizados em relação ao contexto de aquisição, tipo de fundo, usuário executor, sequencias e tipos de gestos. Estas características permitem a criação de casos de testes sob os quais várias propriedades do sistema podem ser aferidas.

Palavras-chave: Ferramenta, Conjuntos de Dados, Sistemas de Análise

Referências

Barros, R., Rodrigues Nt., J. A., Carneiro Filho, H. J. A., Ferreira, F. R. S., Fernandes, O. C., Silva, C. E. P., Ribeiro, A. L. G., Xexeo, G. B., e de Souza, J. M. (2009). A collaborative approach to building evaluated web pages datasets. In Proceedings of the 2009 13th International Conference on Computer Supported Cooperative Work in Design, pages 668–673, Washington, DC, USA. IEEE Computer Society.

Bhaskarabhatla, A., Madhvanath, S., Kumar, M., Balasubramanian, A., e Jawahar, C. (2004). Representation and annotation of online handwritten data. In Frontiers in Handwriting Recognition, 2004. IWFHR-9 2004. Ninth International Workshop on, pages 136–141.

Chen, L., Harper, M., e Quek, F. (2002). Gesture patterns during speech repairs. In Proceedings. Fourth IEEE International Conference on Multimodal Interfaces, pages 155–160. IEEE Comput. Soc.

Dias, D. B., Madeo, R. C. B., Rocha, T., Bíscaro, H. H., e Peres, S. M. (2009). Hand movement recognition for brazilian sign language: A study using distance-based neural networks. In International Joint Conference on Neural Networks, pages 697–704.

Duchowski, A. (2002). A breadth-first survey of eye-tracking applications. Behavior Research Methods, 34:455–470.

Ekman, P., F. W. e Hager, J. (2002). Facial Action Coding System. A Human Face. Salt Lake City, USA.

Gonzalez, R. C. e Woods, R. E. (2000). Processamento de Imagens Digitais. EDGAR BLUCHER.

Just, A., Rodriguez, Y., e Marcel, S. (2006). Hand posture classification and recognition using the modified census transform. In 7th International Conference on Automatic Face and Gesture Recognition, pages 351–356, Southampton.

Kadous, M. W. (1995). Grasp: Recognition of australian sign language using instrumented gloves.

Kendon, A. (1980). The Relation Between Verbal and Nonverbal Communication, chapter Gesticulation and speech: Two Aspects of the Process of Utterance, pages 207–227.

Kita, S., van Gijn, I., e van der Hulst, H. (1998). Movement phases in signs and co-speech gestures, and their transcription by human coders. In Wachsmuth, I. e Frohlich, M., editors, Gesture and Sign Language in Human-Computer Interaction, volume 1371 of Lecture Notes in Computer Science, pages 23–35. Springer Berlin / Heidelberg.

Madeo, R. C. B., Peres, S. M., Bíscaro, H. H., Dias, D. B., e Boscarioli, C. (2010). A committee machine implementing the pattern recognition module for fingerspelling applications. In Proceedings of Symposium on Applied Computing, pages 954–958.

McNeill, D. (1992). Hand and Mind. University of Chicago Press.

Mitra, S. e Acharya, T. (2007). Gesture recognition: A survey. IEEE Trans. on Systems, Man, and Cybernetics - Part C: Applications and Reviews.

Pantic, M., Pentland, A., Nijholt, A., e Huang, T. (2007). Human computing and machine understanding of human behavior: a survey. volume 44512007 of Lecture Notes in Artificial Intelligence, pages 47–71, Berlim. Springer-Verlag.

Quek, F. (2004). The Catchment Feature Model: A Device for Multimodal Fusion and a Bridge between Signal and Sense. EURASIP Journal on Advances in Signal Processing, 2004(11):1619–1636.

Quek, F., McNeill, D., Bryll, R., Duncan, S., Ma, X., Kirbas, C., McCullough, K., e Ansari, R. (2002). Multimodal human discourse: gesture and speech. ACM Transactions on Computer-Human Interaction (TOCHI), 9(3):171–193.

Theodoridis, T. e Hu, H. (2007). Action classification of 3d human models using dynamic anns for mobile robot surveillance. In Robotics and Biomimetics, 2007. ROBIO 2007. IEEE International Conference on, pages 371 –376.

Wahab, M., Amin, H., e Ahmed, F. (2009). Shape analysis of pashto script and creation of image database for ocr. In Emerging Technologies, 2009. ICET 2009. International Conference on, pages 287 –290.
Publicado
16/05/2012
WAGNER, Priscilla K.; BORGES, Guilherme O.; MADEO, Renata C. B.; PERES, Sarajane M.. Uma Ferramenta para Construção de Conjuntos de Dados de Referência para Sistemas de Análise de Gestos Baseados em Imagens. In: SIMPÓSIO BRASILEIRO DE SISTEMAS DE INFORMAÇÃO (SBSI), 8. , 2012, São Paulo. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2012 . p. 423-434. DOI: https://doi.org/10.5753/sbsi.2012.14425.

##plugins.generic.recommendByAuthor.heading##