Reconhecimento de expressões faciais com MediaPipe
Resumo
O reconhecimento de expressões faciais (Facial Expression Recognition - FER) é uma importante subárea da visão computacional e inteligência artificial, com aplicações que variam desde a interação humano-computador até o monitoramento emocional em contextos clínicos. Apesar dos avanços, a maioria dos estudos se concentra em análises baseadas em imagens completas, subestimando a viabilidade dos landmarks faciais como uma alternativa que equilibra privacidade e eficiência computacional. Este artigo propõe e compara três abordagens diferentes: (1) Imagens Completas; (2) Landmarks Renderizados; e (3) Landmarks Vetoriais. Os resultados indicam que, embora a abordagem de Imagens Completas tenha obtido o melhor desempenho em F1-Score: 0,6723, Precision: 0,672 e Recall: 0,676, demonstrando a robustez desta técnica. Contudo, os Landmarks Renderizados, especialmente com o Mapa de Pontos Conectados (MPC), emergem como uma alternativa promissora, equilibrando precisão, eficiência e privacidade.
Referências
B. Fang, Y. Zhao, G. Han, and J. He, “Expression-guided deep joint learning for facial expression recognition,” Sensors, vol. 23, no. 16, 2023. [Online]. Available: [link]
T. Kopalidis, V. Solachidis, N. Vretos, and P. Daras, “Advances in facial expression recognition: A survey of methods, benchmarks, models, and datasets,” Information, vol. 15, no. 3, 2024. [Online]. Available: [link]
D. Ciraolo, M. Fazio, R. S. Calabrò, M. Villari, and A. Celesti, “Facial expression recognition based on emotional artificial intelligence for telerehabilitation,” Biomedical Signal Processing and Control, vol. 92, p. 106096, 2024.
C. C. Chibelushi and F. Bourel, “Facial expression recognition: A brief tutorial overview,” Staffordshire University, ORSYP, Tech. Rep., 2002. [Online]. Available: [link]
Brasil, “Lei geral de protec¸ ˜ao de dados pessoais, lei nº 13.709, de 14 de agosto de 2018,” [link], 2018.
P. V. K. Sandeep and N. S. Kumar, “Pain detection through facial expressions in children with autism using deep learning,” Soft Computing, vol. 28, pp. 4621–4630, 2024. [Online]. Available: DOI: 10.1007/s00500-024-09696-x
K. He, X. Zhang, S. Ren, and J. Sun, “Deep residual learning for image recognition,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2016, pp. 770–778. [Online]. Available: [link]
S. J. Pan and Q. Yang, “A survey on transfer learning,” IEEE Transactions on Knowledge and Data Engineering, vol. 22, no. 10, pp. 1345–1359, 2010. [Online]. Available: [link]
Z. Zhao, S. Xu, B. H. Kang, M. M. J. Kabir, Y. Liu, and R. Wasinger, “Investigation and improvement of multi-layer perceptron neural networks for credit scoring,” Expert Systems with Applications, vol. 42, no. 7, pp. 3508–3516, 2015. [Online]. Available: [link]
T. D. Science, “The annotated resnet-50,” Towards Data Science, 2021. [Online]. Available: [link]
M. Sokolova and G. Lapalme, “A systematic analysis of performance measures for classification tasks,” Information Processing & Management, vol. 45, no. 4, pp. 427–437, 2009. [Online]. Available: [link]
J. Davis and M. Goadrich, “The relationship between precision-recall and roc curves,” in Proceedings of the 23rd international conference on Machine learning, 2006, pp. 233–240. [Online]. Available: [link]