NeuralMatch: Identificando a Similaridade de Clientes baseado em Modelos no Aprendizado Federado
Resumo
O aprendizado federado é uma técnica de aprendizado de máquina distribuído que permite que vários dispositivos colaborem no treinamento de um modelo de dados comum, enquanto preserva a privacidade dos dados do usuário. No entanto, o aprendizado federado apresenta desafios relacionados aos dados não identicamente distribuídos e balanceados, o que pode resultar em modelos menos precisos. Dessa forma, foi proposto o NeuralMatch, um arcabouço para identificar similaridade de modelos para aprendizado federado, capaz de identificar a similaridade entre os clientes sem o compartilhamento de dados. O arcabouço proposto pode ajudar a desenvolver soluções mais eficientes de aprendizado federado para lidar com os problemas de dados não identicamente balanceados e distribuídos.
Referências
Beutel, D. J., Topal, T., Mathur, A., Qiu, X., Parcollet, T., and Lane, N. D. (2020). Flower: A friendly federated learning research framework. arXiv preprint arXiv:2007.14390.
Goddard, M. (2017). The eu general data protection regulation (gdpr): European regulation that has a global impact. International Journal of Market Research, 59(6):703–705.
Imteaj, A., Thakker, U., Wang, S., Li, J., and Amini, M. H. (2022). A survey on federated learning for resource-constrained iot devices. IEEE Internet of Things Journal, 9(1):1–24.
Kornblith, S., Norouzi, M., Lee, H., and Hinton, G. (2019). Similarity of neural network representations revisited. In International Conference on Machine Learning, pages 3519–3529. PMLR.
Levina, E. and Bickel, P. (2001). The earth mover’s distance is the mallows distance: some insights from statistics. In Proceedings Eighth IEEE International Conference on Computer Vision. ICCV 2001, volume 2, pages 251–256 vol.2.
Lim, W. Y. B., Luong, N. C., Hoang, D. T., Jiao, Y., Liang, Y.-C., Yang, Q., Niyato, D., and Miao, C. (2020). Federated learning in mobile edge networks: A comprehensive survey. IEEE Communications Surveys Tutorials, 22(3):2031–2063.
Liu, B., Ding, M., Shaham, S., Rahayu, W., Farokhi, F., and Lin, Z. (2021). When machine learning meets privacy: A survey and outlook. ACM Comput. Surv., 54(2).
McMahan, B., Moore, E., Ramage, D., Hampson, S., , and Arcas, B. A. (2017). Communication-efficient learning of deep networks from decentralized data.
Pinheiro, P. P. (2020). Proteção de Dados Pessoais: Comentários à Lei n. 13.709/2018-LGPD. Saraiva Educação SA.
Rubner, Y., Tomasi, C., and Guibas, L. (1998). A metric for distributions with applications to image databases. In Sixth International Conference on Computer Vision (IEEE Cat. No.98CH36271), pages 59–66.
Vaizman, Y., Ellis, K., and Lanckriet, G. (2017). Recognizing detailed human context in the wild from smartphones and smartwatches. IEEE Pervasive Computing, 16(4):62–74.