Aprendizado Federado Sensível ao Risco em Modelos de Ranqueamento
Resumo
Essa dissertação explora o uso do Aprendizado Federado para Ranqueamento (Federated Learning to Rank - FL2R), uma técnica empregada em sistemas de busca que considera a privacidade dos dados de diversos clientes. O FL2R envolve a construção de um modelo de ranqueamento executado de forma distribuída em vários dispositivos. Após o treino, os parâmetros das redes neurais dos clientes são combinados, resultando em um novo modelo neural que será distribuído aos clientes. Considerado o estado da arte em Federated Learning (FL), o método Federated Averaging (FedAvg) calcula a média de parâmetros para construir o modelo agregado. Contudo, clientes com baixo desempenho podem distorcer a média de forma enviesada, resultando em uma redução na efetividade do modelo global. Para contribuir na solução desse problema, propomos o estudo de técnicas de agregação que superem a simples média aritmética dos pesos, além de aplicar métricas na área de Sensibilidade ao Risco, tentando mitigar a variância dos modelos no lado do cliente. Embora o trabalho esteja em fase inicial, neste artigo foi possível mostrar alguns experimentos fazendo uso de Projeto Fatorial para avaliação de fatores que possam impactar a efetividade dos modelos federados. Os resultados mostram que combinar os valores dos parâmetros não é uma tarefa trivial, mas considerando as perguntas de pesquisa propostas acreditamos que esse trabalho tem forte potencial de contribuição na área de Recuperação de Informação.
Referências
Deng, L. (2012). The mnist database of handwritten digit images for machine learning research. IEEE Signal Processing Magazine, 29(6):141–142.
Divi, S., Lin, Y.-S., Farrukh, H., and Celik, Z. B. (2021). New metrics to evaluate the performance and fairness of personalized federated learning.
Jain, R. (1991). The Art of Systems Performance Analysis: Techniques for experimental design, Measurement, simulation, and modeling. John Wiley amp; Sons.
Jiang, J. C., Kantarci, B., Oktug, S., and Soyata, T. (2020). Federated learning in smart city sensing: Challenges and opportunities. Sensors, 20(21):6230.
Kairouz, P., McMahan, H. B., Avent, B., Bellet, A., Bennis, et al. (2021). Advances and open problems in federated learning. Foundations and Trends® in Machine Learning, 14(1–2):1–210.
McMahan, H. B., Moore, E., Ramage, D., Hampson, S., and y Arcas, B. A. (2023). Communication-efficient learning of deep networks from decentralized data.
Mukut, S., Kakoli, G., and Jyotika, B. (2012). Federated search: An information retrieval strategy for scholarly literature.
Silva Rodrigues, P. H., Xavier Sousa, D., Couto Rosa, T., and Gonçalves, M. A. (2022). Risk-sensitive deep neural learning to rank. In ACM SIGIR Conference, SIGIR ’22, page 803–813.
Wang, S. and Zuccon, G. (2022). Is non-iid data a threat in federated online learning to rank? In ACM SIGIR Conference, SIGIR ’22, page 2801–2813.
Ye, Y., Li, S., Liu, F., Tang, Y., and Hu,W. (2020). Edgefed: Optimized federated learning based on edge computing. IEEE Access, 8:209191–209198.