Análise da Execução de Algoritmos de Aprendizado de Máquina em Dispositivos Embarcados
Resumo
Os avanços na área de IoT motivam a utilização de algoritmos de aprendizado de máquina em dispositivos embarcados. Entretanto, esses algoritmos exigem uma quantidade considerável de recursos computacionais. O objetivo deste trabalho consistiu em analisar algoritmos de aprendizado de máquina em dispositivos embarcados utilizando paralelismo em CPU e GPU com o intuito de compreender quais características de hardware e software desempenham melhor em relação ao consumo energético, inferências por segundo e acurácia. Foram avaliados três modelos de Convolutional Neural Network, bem como algoritmos tradicionais e redes neurais de classificação e regressão. Os experimentos demonstraram que o PyTorch obteve o melhor desempenho nos modelos de CNN e nas redes neurais de classificação e regressão usando GPU, enquanto o Keras obteve um melhor desempenho ao utilizar somente CPU.
Referências
de Oliveira, D. C. and Wehrmeister, M. A. (2018). Using deep learning and low-cost rgb and thermal cameras to detect pedestrians in aerial images captured by multirotor uav. Sensors Journal (Switzerland), 18(7).
Karunaratna, S. and Maduranga, P. (2021). Artificial intelligence on single board computers: An experiment on sound event classification. In 2021 5th SLAAI International Conference on Artificial Intelligence (SLAAI-ICAI), pages 1–5.
Lacamera, D. (2018). Embedded Systems Architecture: Explore architectural concepts, pragmatic design patterns, and best practices to produce robust systems. Packt Publishing.
Lee, J., Wang, P., Xu, R., Dasari, V., Weston, N., Li, Y., Bagchi, S., and Chaterji, S. (2021). Benchmarking video object detection systems on embedded devices under resource contention. In Proceedings of the 5th International Workshop on Embedded and Mobile Deep Learning, EMDL’21, page 19–24, New York, NY, USA. Association for Computing Machinery.
Magalhães, S. C., dos Santos, F. N., Machado, P., Moreira, A. P., and Dias, J. (2023). Benchmarking edge computing devices for grape bunches and trunks detection using accelerated object detection single shot multibox deep learning models. Engineering Applications of Artificial Intelligence, 117:105604.
Mohebbanaaz, Padma Sai, Y., and et al. (2022). Cognitive assistant deepnet model for detection of cardiac arrhythmia. Biomedical Signal Processing and Control, 71.
Nikouei, S. Y. e. a. (2018). Smart surveillance as an edge network service: From harrcascade, svm to a lightweight cnn. In 2018 IEEE 4th International Conference on Collaboration and Internet Computing (CIC), pages 256–265.
Pajankar, A. (2020). Raspberry Pi Computer Vision Programming: Design and implement computer vision applications with Raspberry Pi, OpenCV, and Python 3, 2nd Edition. Packt Publishing.
Savvidis, P. and Papakostas, G. A. (2021). Remote crop sensing with iot and ai on the edge. page 48 – 54.
Süzen, A. A., Duman, B., and Şen, B. (2020). Benchmark analysis of jetson tx2, jetson nano and raspberry pi using deep-cnn. In 2020 International Congress on Human-Computer Interaction, Optimization and Robotic Applications (HORA), pages 1–5.