FedTimeGAN: Geração de Dados Sintéticos de Séries Temporais via Aprendizado Federado de Redes Adversárias Generativas
Resumo
O monitoramento por meio de acelerômetros é útil para avaliar a qualidade da atividade física das pessoas. Como os dados coletados são tipicamente séries temporais, dependentes do tamanho e da consistência dos dados, pode ser necessário utilizar técnicas de geração de dados sintéticos. A privacidade dos dados é essencial para dados pessoais de usuários, mesmo que sintéticos, e compartilhá-los para treinar modelos pode não ser adequado. O aprendizado federado permite o treinamento dos modelos sem compartilhar os dados entre os clientes. Neste trabalho, é proposto um modelo de geração de dados sintéticos de séries temporais para atividade física por meio de aprendizado federado e Redes Adversárias Generativas (GANs), denominado FedTimeGAN. Foi realizada uma análise comparativa entre treinamento federado e centralizado para o modelo de geração de dados sintéticos de séries temporais. Os resultados obtidos revelam que a abordagem federada pode ser mais eficaz na geração de dados sintéticos de alta qualidade para esse tipo de aplicação, com dados de múltiplos usuários, além de manter a privacidade.
Referências
Li, W., Chen, J., Wang, Z., Shen, Z., Ma, C., and Cui, X. (2023). Ifl-gan: Improved federated learning generative adversarial network with maximum mean discrepancy model aggregation. IEEE Transactions on Neural Networks and Learning Systems, 34:10502–10515.
McMahan, B., Moore, E., Ramage, D., Hampson, S., and y Arcas, B. A. (2017). Communication-efficient learning of deep networks from decentralized data. In Artificial intelligence and statistics, pages 1273–1282. PMLR.
Mo, L., Liu, S., Gao, R. X., John, D., Staudenmayer, J. W., and Freedson, P. S. (2012). Wireless design of a multisensor system for physical activity monitoring. IEEE transactions on Biomedical Engineering, 59(11):3230–3237.
Ranja, F., Nababan, E. B., and Candra, A. (2023). Synthetic data generation using time-generative adversarial network (time-gan) to predict cash atm. In 2023 International Conference on Computer, Control, Informatics and its Applications (IC3INA), pages 418–423. IEEE.
Reiss, A. (2012). PAMAP2 Physical Activity Monitoring. UCI Machine Learning Repository. DOI: 10.24432/C5NW2H.
Tolstikhin, I. O., Sriperumbudur, B. K., and Schölkopf, B. (2016). Minimax estimation of maximum mean discrepancy with radial kernels. Advances in Neural Information Processing Systems, 29.
Xin, B., Yang, W., Geng, Y., Chen, S., Wang, S., and Huang, L. (2020). Private flgan: Differential privacy synthetic data generation based on federated learning. pages 2927–2931.
Yoon, J., Jarrett, D., and Van der Schaar, M. (2019). Time-series generative adversarial networks. Advances in neural information processing systems, 32.
Zhang, Y., Zhang, Q., Yang, M., Xiao, T., and Wang, Z. (2023). Fedgan: Federated gan for few-shot image generation. pages 1020–1024. Institute of Electrical and Electronics Engineers Inc.