Aprendizado Federado Sensível ao Risco em Modelos de Ranqueamento

Gestefane Rabbi Magalhães; Marcos André Gonçalves; Daniel Xavier de Sousa; Celso França

doi:10.5753/sbbd_estendido.2023.233698

Gestefane Rabbi Magalhães Universidade Federal de Minas Gerais (UFMG)
Marcos André Gonçalves Universidade Federal de Minas Gerais (UFMG)
Daniel Xavier de Sousa Instituto Federal de Goiás (IFG)
Celso França Universidade Federal de Minas Gerais (UFMG)

DOI: https://doi.org/10.5753/sbbd_estendido.2023.233698

Resumo

Essa dissertação explora o uso do Aprendizado Federado para Ranqueamento (Federated Learning to Rank - FL2R), uma técnica empregada em sistemas de busca que considera a privacidade dos dados de diversos clientes. O FL2R envolve a construção de um modelo de ranqueamento executado de forma distribuída em vários dispositivos. Após o treino, os parâmetros das redes neurais dos clientes são combinados, resultando em um novo modelo neural que será distribuído aos clientes. Considerado o estado da arte em Federated Learning (FL), o método Federated Averaging (FedAvg) calcula a média de parâmetros para construir o modelo agregado. Contudo, clientes com baixo desempenho podem distorcer a média de forma enviesada, resultando em uma redução na efetividade do modelo global. Para contribuir na solução desse problema, propomos o estudo de técnicas de agregação que superem a simples média aritmética dos pesos, além de aplicar métricas na área de Sensibilidade ao Risco, tentando mitigar a variância dos modelos no lado do cliente. Embora o trabalho esteja em fase inicial, neste artigo foi possível mostrar alguns experimentos fazendo uso de Projeto Fatorial para avaliação de fatores que possam impactar a efetividade dos modelos federados. Os resultados mostram que combinar os valores dos parâmetros não é uma tarefa trivial, mas considerando as perguntas de pesquisa propostas acreditamos que esse trabalho tem forte potencial de contribuição na área de Recuperação de Informação.

Palavras-chave: Aprendizado Federado para ranqueamento, Sistemas de busca, Privacidade dos dados

Referências

Ai, Q., Bi, K., Guo, J., and Croft, W. B. (2018). Learning a deep listwise context model for ranking refinement. In ACM SIGIR conference, pages 135–144.

Deng, L. (2012). The mnist database of handwritten digit images for machine learning research. IEEE Signal Processing Magazine, 29(6):141–142.

Divi, S., Lin, Y.-S., Farrukh, H., and Celik, Z. B. (2021). New metrics to evaluate the performance and fairness of personalized federated learning.

Jain, R. (1991). The Art of Systems Performance Analysis: Techniques for experimental design, Measurement, simulation, and modeling. John Wiley amp; Sons.

Jiang, J. C., Kantarci, B., Oktug, S., and Soyata, T. (2020). Federated learning in smart city sensing: Challenges and opportunities. Sensors, 20(21):6230.

Kairouz, P., McMahan, H. B., Avent, B., Bellet, A., Bennis, et al. (2021). Advances and open problems in federated learning. Foundations and Trends® in Machine Learning, 14(1–2):1–210.

McMahan, H. B., Moore, E., Ramage, D., Hampson, S., and y Arcas, B. A. (2023). Communication-efficient learning of deep networks from decentralized data.

Mukut, S., Kakoli, G., and Jyotika, B. (2012). Federated search: An information retrieval strategy for scholarly literature.

Silva Rodrigues, P. H., Xavier Sousa, D., Couto Rosa, T., and Gonçalves, M. A. (2022). Risk-sensitive deep neural learning to rank. In ACM SIGIR Conference, SIGIR ’22, page 803–813.

Wang, S. and Zuccon, G. (2022). Is non-iid data a threat in federated online learning to rank? In ACM SIGIR Conference, SIGIR ’22, page 2801–2813.

Ye, Y., Li, S., Liu, F., Tang, Y., and Hu,W. (2020). Edgefed: Optimized federated learning based on edge computing. IEEE Access, 8:209191–209198.