Tendências em Hardware e Estratégias de Otimização para Deep Learning na Borda: Uma Revisão para a Indústria 5.0

Heduardo Witkoski Barcelos da Rocha; Fábio Luís Livi Ramos

doi:10.5753/eradrs.2026.21442

Heduardo Witkoski Barcelos da Rocha UNIPAMPA
Fábio Luís Livi Ramos UNIPAMPA

DOI: https://doi.org/10.5753/eradrs.2026.21442

Resumo

A transição para a Indústria 5.0 exige que modelos de Deep Learning (DL) operem localmente em dispositivos de borda para garantir baixa latência e privacidade. Contudo, arquiteturas tradicionais enfrentam limitações severas devido ao custo energético do tráfego de dados. Este artigo fornece uma revisão de componentes de DL, otimizações de software e tendências de hardware. A contribuição central é uma análise de estratégias para mitigar o gargalo de von Neumann em ambientes com restrição de recursos.

Referências

Boumendil, A., Bechkit, W., and Benatchba, K. (2024). On-device deep learning: Survey on techniques improving energy efficiency of dnns. IEEE Transactions on Neural Networks and Learning Systems. Early Access.

Chen, Y.-H., Krishna, T., Emer, J. S., and Sze, V. (2017). Eyeriss: An energy-efficient reconfigurable accelerator for deep convolutional neural networks. IEEE Journal of Solid-State Circuits, 52(1):127–138.

Haris, J., Gibson, P., Cano, J., Agostini, N. B., and Kaeli, D. (2023). SECDA: Efficient hardware/software co-design of FPGA-based DNN accelerators for edge inference. Journal of Parallel and Distributed Computing, 173:140–151.

Howard, A. G., Zhu, M., Chen, B., Kalenichenko, D., Wang, W., Weyand, T., Andreetto, M., and Adam, H. (2017). Mobilenets: Efficient convolutional neural networks for mobile vision applications. arXiv preprint arXiv:1704.04861.

Iandola, F. N., Han, S., Moskewicz, M. W., Ashraf, K., Dally, W. J., and Keutzer, K. (2016). Squeezenet: Alexnet-level accuracy with 50x fewer parameters and ¡0.5 mb model size. arXiv preprint arXiv:1602.07360.

Moreira, L. F. R., Moreira, R., Travençolo, B. A. N., and Backes, A. R. (2025). Deep learning based image classification for embedded devices: A systematic review. Neurocomputing, 623:129402.

Samanta, A., Hatai, I., and Mal, A. K. (2024). A survey on hardware accelerator design of deep learning for edge devices. Wireless Personal Communications, 137:1715–1760.

Xia, M., Huang, Z., Tian, L., Wang, H., Chang, V., Zhu, Y., and Feng, S. (2021). Spark-noc: an energy-efficiency fpga-based accelerator using optimized lightweight cnn for edge computing. Journal of Systems Architecture, 115:101991.

Zaman, K. S., Reaz, M. B. I., Md Ali, S. H., Bakar, A. A. A., and Chowdhury, M. E. H. (2022). Custom hardware architectures for deep learning on portable devices: A review. IEEE Transactions on Neural Networks and Learning Systems, 33(11):6068–6088.