Análise de Hiperparâmetros em Aplicações de Aprendizado Profundo por meio de Dados de Proveniência

  • Débora B. Pina UFRJ
  • Liliane Neves UFRJ
  • Aline Paes UFRJ
  • Daniel de Oliveira UFF
  • Marta Mattoso UFRJ

Resumo


O treinamento das Redes Neurais Convolucionais (CNN) requer o ajuste de hiperparâmetros. As soluções existentes para auxiliar a escolha das melhores combinações de hiperparâmetros definem uma representação própria para modelar os relacionamentos de derivação dos dados. Essa representação proprietária dificulta a análise de dados e a interoperabilidade. Este artigo propõe a CNNProv, que adota o padrão W3C PROV para representar relacionamentos de derivação de dados para facilitar a análise das combinações de hiperparâmetros, contribuindo assim para a fase de treinamento das CNNs. A CNNProv captura dados de proveniência e permite a análise de valores de hiperparâmetros durante a execução. Os experimentos mostram a adequação do W3C PROV para a análise de hiperparâmetros e contribui para a qualidade e confiabilidade dos resultados de CNN, com overhead desprezível de até, no máximo, 4%.

Palavras-chave: convolutional neural networks, hyperparameters, provenance, data analysis

Referências

Abadi, M., Agarwal, A., Barham, P., Brevdo, E., Chen, Z., Citro, C., Corrado, G. S., Davis, A., Dean, J., Devin, M., et al. (2016). Tensorflow: Large-scale machine learning on heterogeneous distributed systems. arXiv preprint arXiv:1603.04467.

Bergstra, J. and Bengio, Y. (2012). Random search for hyper-parameter optimization. Journal of Machine Learning Research, 13(Feb):281–305.

Freire, J., Koop, D., Santos, E., and Silva, C. T. (2008). Provenance for computational tasks: A survey. Computing in Science and Engineering, 10(3):11–21. DOI: https://doi.org/10.1109/mcse.2008.79

Goodfellow, I., Bengio, Y., and Courville, A. (2016). Deep learning. MIT press. DOI: https://doi.org/10.1007/s10710-017-9314-z

He, Y., Lin, J., Liu, Z., Wang, H., Li, L.-J., and Han, S. (2018). Amc: Automl for model compression and acceleration on mobile devices. In Proceedings of the ECCV, pages 784–800. DOI: https://doi.org/10.1007/978-3-030-01234-2_48

Krizhevsky, A., Sutskever, I., and Hinton, G. E. (2012). Imagenet classification with deep convolutional neural networks. In Adv. in neural inf. proc. sys., pages 1097–1105. DOI: https://doi.org/10.1145/3065386

Lecun, Y., Bottou, L., Bengio, Y., and Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11):2278–2324. DOI: https://doi.org/10.1109/5.726791

Moreau, L. and Groth, P. T. (2013). Provenance: An Introduction to PROV. Synthesis Lectures on the Semantic Web: Theory and Technology. Morgan & Claypool Publishers. DOI: https://doi.org/10.2200/s00528ed1v01y201308wbe007

Schelter, S., B¨ose, J.-H., Kirschnick, J., Klein, T., and Seufert, S. (2017). Automatically tracking metadata and provenance of machine learning experiments. In MLS workshop @ NIPS.

Silva, V., de Oliveira, D., Mattoso, M., and Valduriez, P. (2018). Dfanalyzer: Runtime dataflow analysis of scientific applications using provenance. PVLDB, 11(12):2082–2085. DOI: https://doi.org/10.14778/3229863.3236265

Souza, R., Neves, L., Azeredo, L., Luiz, R., Tady, E., Cavalin, P. R., and Mattoso, M. (2018). Towards a human-in-the-loop library for tracking hyperparameter tuning in deep learning development. In LADaS@VLDB.

Stamatogiannakis, M., Kazmi, H., Sharif, H., Vermeulen, R., Gehani, A., Bos, H., and Groth, P. (2016). Trade-offs in automatic provenance capture. In IPAW, pages 29–41. Springer. DOI: https://doi.org/10.1007/978-3-319-40593-3_3

Vanschoren, J., van Rijn, J. N., Bischl, B., and Torgo, L. (2014). Openml: Networked science in machine learning. SIGKDD Explor. Newsl., 15(2):49–60. DOI: https://doi.org/10.1145/2641190.2641198
Publicado
07/10/2019
PINA, Débora B.; NEVES, Liliane; PAES, Aline; DE OLIVEIRA, Daniel; MATTOSO, Marta. Análise de Hiperparâmetros em Aplicações de Aprendizado Profundo por meio de Dados de Proveniência. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS (SBBD), 34. , 2019, Fortaleza. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 223-228. ISSN 2763-8979. DOI: https://doi.org/10.5753/sbbd.2019.8827.