Análise Teórica do Impacto de Dados Faltantes em Atributos Sensíveis sobre a Métrica de Fairness p%-rule
Resumo
A avaliação da justiça algorítmica tem se tornado um tópico central na análise de sistemas de decisão automatizados. Neste artigo, investigamos como o uso de técnicas de imputação para preencher dados sensíveis ausentes pode afetar o valor da métrica p%-rule, dependendo do grau de erro na imputação. Propomos um modelo matemático formal para quantificar esse impacto, considerando erros de imputação simétricos e bidirecionais. Além disso, determinamos a quantidade mínima de correções manuais necessárias para garantir uma melhoria desejada na métrica de fairness. Os resultados oferecem uma base quantitativa para entender os trade-offs entre custo de intervenção manual e qualidade dos dados imputados na análise de justiça algorítmica.
Referências
Barocas, S. and Selbst, A. D. (2016). Big data’s disparate impact. California Law Review, 104(3):671–732.
Feldman, M., Friedler, S. A., Moeller, J., Scheidegger, C., and Venkatasubramanian, S. (2015). Certifying and removing disparate impact. In proceedings of the 21th ACM SIGKDD international conference on knowledge discovery and data mining, pages 259–268.
Fernando, M.-P., Cèsar, F., David, N., and José, H.-O. (2021). Missing the missing values: The ugly duckling of fairness in machine learning. International Journal of Intelligent Systems, 36(7):3217–3258.
Little, R. J. and Rubin, D. B. (2019). Statistical Analysis with Missing Data. John Wiley & Sons.
Mehrabi, N., Morstatter, F., Saxena, N., Lerman, K., and Galstyan, A. (2021). A survey on bias and fairness in machine learning. ACM computing surveys (CSUR), 54(6):1–35.
Mitchell, S. e. a. (2021). Algorithmic fairness: Choices, assumptions, and definitions. Communications of the ACM, 64(5):58–66.
Oliveira, T. A., Oliveira, J. V., Farias, T. P., Cruz, E. W., Andrade, L. J., and Pita, R. (2024). Estudo experimental sobre justiça algorítmica aplicada em modelos de análise de crédito. In Simpósio Brasileiro de Banco de Dados (SBBD), pages 29–36. SBC.
Wang, Y. and Singh, L. (2021). Analyzing the impact of missing values and selection bias on fairness. International Journal of Data Science and Analytics, 12(2):101–119.
Zafar, M. B., Valera, I., Rogriguez, M. G., and Gummadi, K. P. (2017). Fairness constraints: Mechanisms for fair classification. In Artificial intelligence and statistics, pages 962–970. PMLR.
