Explorando Mapeamentos de Threads e Dados para Melhoria de Desempenho de Algoritmos de Aprendizado de Máquina
Resumo
Algoritmos de Aprendizado de Máquina (ML) são cada vez mais utilizados em diversos problemas científicos e industriais, tendo como uma preocupação importante o tempo de execução destes algoritmos. Neste trabalho exploramos mapeamentos de threads e dados e o impacto em novos algoritmos de ML. Resultados experimentos mostraram que os algoritmos SRCNN e MobileNet apresentaram tempos de execução até 15.1% menores e mais uniformes.
Referências
Diener, M., Cruz, E. H., Alves, M. A., Navaux, P. O., and Koren, I. (2016). Affinitybased thread and data mapping in shared memory systems. ACM Computing Surveys (CSUR), 49(4):1–38.
Dong, C., Loy, C. C., He, K., and Tang, X. (2015). Image super-resolution using deep convolutional networks. IEEE transactions on pattern analysis and machine intelligence, 38(2):295–307.
Ignatov, A., Timofte, R., Kulik, A., Yang, S., Wang, K., Baum, F., Wu, M., Xu, L., and Van Gool, L. (2019). Ai benchmark: All about deep learning on smartphones in 2019. arXiv preprint arXiv:1910.06663.
Perols, J. (2011). Financial statement fraud detection: An analysis of statistical and machine learning algorithms. Auditing: A Journal of Practice & Theory, 30(2):19–50.
Sandler, M., Howard, A., Zhu, M., Zhmoginov, A., and Chen, L.-C. (2018). Mobilenetv2: Inverted residuals and linear bottlenecks. In Proceedings of the IEEE conference on computer vision and pattern recognition, pages 4510–4520.
Serpa, M. S., Cruz, E. H., Diener, M., Krause, A. M., Navaux, P. O., Panetta, J., Farrés, A., Rosas, C., and Hanzich, M. (2019). Optimization strategies for geophysics models on manycore systems. The International Journal of High Performance Computing Applications, 33(3):473–486.
Serpa, M. S., Krause, A. M., Cruz, E. H., Navaux, P. O. A., Pasin, M., and Felber, P. (2018). Optimizing machine learning algorithms on multi-core and many-core architectures using thread and data mapping. In 2018 26th Euromicro International Conference on Parallel, Distributed and Network-based Processing (PDP), pages 329–333. IEEE.
Stavens, D. M. et al. (2011). Learning to drive: Perception for autonomous cars. PhD thesis, Citeseer.