Justiça nas previsões de modelos de Aprendizado de Máquina: um estudo de caso com dados de reincidência criminal

  • Ronaldo Lopes Inocêncio Júnior ITA
  • Leonardo Silveira ITA
  • Victor Castro Nacif de Faria ITA / UNIFESP
  • Ana Carolina Lorena ITA

Resumo


O uso de técnicas de Ciência de Dados e Inteligência Artificial permeia diversas áreas críticas hoje em dia. Isso inclui a lei e justiça, onde alguns modelos de decisão baseados em dados dão suporte para determinar o risco de reincidência de condenados. Este artigo analisa os dados de reincidência criminal do conjunto de dados COMPAS com técnicas de Aprendizado de Máquina. Esse conjunto de dados contém dados de criminosos nos EUA e seu risco de reincidência. Especificamente, focamos na justiça das decisões dos modelos gerados a partir desses dados em relação ao atributo de etnia dos indivíduos. Como o viés racial foi encontrado dentro do conjunto de dados como uma consequência da assimetria deste atributo em relação à variável alvo, também experimentamos um balanceamento simples do conjunto de dados em relação ao atributo etnia.

Referências

Ahmad, M. A., Teredesai, A., and Eckert, C. (2020). Fairness, accountability, transparency in ai at scale: Lessons from national programs. In Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency, pages 690-690.

AlQuraishi, M. (2021). Machine learning in protein structure prediction. Current opinion in chemical biology, 65:1-8.

Angwin, J., Larson, J., Mattu, S., and Kirchner, L. (2016). Machine bias: there's software used across the country to predict future criminals and it's biased against blacks. [link].

Awoyemi, J. O., Adetunmbi, A. O., and Oluwadare, S. A. (2017). Credit card fraud detection using machine learning techniques: A comparative analysis. In 2017 International Conference on Computing Networking and Informatics (ICCNI), pages 1-9.

Botha, J. and Pieterse, H. (2020). Fake news and deepfakes: A dangerous threat for 21st century information security. In ICCWS 2020 15th International Conference on Cyber Warfare and Security. Academic Conferences and publishing limited, page 57.

Bunker, R. P. and Thabtah, F. (2019). A machine learning framework for sport result prediction. Applied computing and informatics, 15(1):27-33.

Corbett-Davies, S. and Goel, S. (2018). The measure and mismeasure of fairness: A critical review of fair machine learning. arXiv preprint arXiv:1808.00023.

Demšar, J. (2006). Statistical comparisons of classifiers over multiple data sets. The Journal of Machine learning research, 7:1-30.

Fuchs, D. J. (2018). The dangers of human-like bias in machine-learning algorithms. Missouri S&T's Peer to Peer, 2(1):1.

Garcia, M. (2017). Racist in the machine: The disturbing implications of algorithmic bias. retrieved december 03, 2017.

Hart, G. L., Mueller, T., Toher, C., and Curtarolo, S. (2021). Machine learning for alloys. Nature Reviews Materials, 6(8):730-755.

Khademi, A. and Honavar, V. (2020). Algorithmic bias in recidivism prediction: A causal perspective (student abstract). In Proceedings of the AAAI Conference on Artificial Intelligence, volume 34, pages 13839-13840.

Khosla, A., Zhou, T., Malisiewicz, T., Efros, A. A., and Torralba, A. (2012). Undoing the damage of dataset bias. In European Conference on Computer Vision, pages 158-171. Springer.

Mehrabi, N., Morstatter, F., Saxena, N., Lerman, K., and Galstyan, A. (2021). A survey on bias and fairness in machine learning. ACM Comput. Surv., 54(6).

Meuwly, M. (2021). Machine learning for chemical reactions. Chemical Reviews, 121(16):10218-10239.

Mohammad-Rahimi, H., Nadimi, M., Ghalyanchi-Langeroudi, A., Taheri, M., and Ghafouri-Fard, S. (2021). Application of machine learning in diagnosis of covid-19 through x-ray and ct images: a scoping review. Frontiers in cardiovascular medicine, 8:185.

Paiva, P. Y. A., Moreno, C. C., Smith-Miles, K., Valeriano, M. G., and Lorena, A. C. (2022). Relating instance hardness to classification performance in a dataset: a visual approach. Machine Learning, 111(8):3085-3123.

Prates, M. O., Avelar, P. H., and Lamb, L. C. (2020). Assessing gender bias in machine translation: a case study with google translate. Neural Computing and Applications, 32(10):6363-6381.

Rudin, C., Wang, C., and Coker, B. (2020). The age of secrecy and unfairness in recidivism prediction. Harvard Data Science Review, 2(1). https://hdsr.mitpress.mit.edu/pub/7z10o269.

Salgueiro, A. T. F. (2020). Detecção de problemas cardíacos usando sinais de electrocardiograma (ECG). PhD thesis, Universidade de Coimbra.

Storm, H., Baylis, K., and Heckelei, T. (2020). Machine learning in agricultural and applied economics. European Review of Agricultural Economics, 47(3):849-892.

Usmani, M., Adil, S. H., Raza, K., and Ali, S. S. A. (2016). Stock market prediction using machine learning techniques. In 2016 3rd international conference on computer and information sciences (ICCOINS), pages 322-327. IEEE.
Publicado
28/11/2022
INOCÊNCIO JÚNIOR, Ronaldo Lopes; SILVEIRA, Leonardo; FARIA, Victor Castro Nacif de; LORENA, Ana Carolina. Justiça nas previsões de modelos de Aprendizado de Máquina: um estudo de caso com dados de reincidência criminal. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 19. , 2022, Campinas/SP. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2022 . p. 636-647. ISSN 2763-9061. DOI: https://doi.org/10.5753/eniac.2022.227610.