Explicando os “E se?” por Trás da Detecção de Violência Física Infantil: Uma Abordagem Contrafactua
Resumo
Os modelos de aprendizado de máquina são amplamente utilizados, mas a interpretabilidade limitada compromete a transparência, especialmente em casos sensíveis. Este estudo utiliza o método CSSE para produzir explicações contrafactuais para a disciplina física violenta, usando o conjunto de dados MICS da UNICEF e um modelo XGBoost. Os resultados mostram que as crenças sobre punição física e redirecionamento comportamental são fatores-chave, e pequenas mudanças nessas variáveis alteram as previsões do modelo. Essas descobertas demonstram que as explicações contrafactuais esclarecem o comportamento do modelo e ajudam a orientar intervenções para promover o bem-estar infantil.
Referências
J. Bergstra e Y. Bengio. Random search for hyper-parameter optimization. Journal of Machine Learning Research, 13:281–305, 2012.
R. Caruana et al. Intelligible models for healthcare: Predicting pneumonia risk and hospital 30-day readmission. In Proceedings of the 21th ACM SIGKDD, 2015.
C. S. Carvalho, J. C. Mattos, e M. S. Aguiar. Interpretabilidade e justiça algorítmica: Avançando na transparência de modelos preditivos de evasão escolar. In Simpósio Brasileiro de Informática na Educação (SBIE), pages 1658–1673. SBC, 2024.
M. de Sousa Balbino, L. E. Z. Gálvez, e C. N. Nobre. CSSE - an agnostic method of Counterfactual, Selected, and Social Explanations for classification models. Expert Systems with Applications, 228:120373, 2023. ISSN 0957-4174. URL [link].
J. Demšar. Statistical comparisons of classifiers over multiple data sets. Journal of Machine Learning Research, 7:1–30, 2006.
O. Gomez, S. Holter, J. Yuan, e E. Bertini. Advice: Aggregated visual counterfactual explanations for machine learning model validation. In 2021 IEEE Visualization Conference (VIS), pages 31–35. IEEE, 2021.
R. Guidotti, A. Monreale, S. Ruggieri, F. Turini, F. Giannotti, e D. Pedreschi. A survey of methods for explaining black box models. ACM Computing Surveys (CSUR), 51(5): 93, 2018. DOI: 10.1145/3236009.
R. Guidotti, A. Monreale, F. Giannotti, D. Pedreschi, S. Ruggieri, e F. Turini. Factual and counterfactual explanations for black box decision making. IEEE Intelligent Systems, PP:1–1, 12 2019. DOI: 10.1109/MIS.2019.2957223.
A.-H. Karimi, G. Barthe, B. Schölkopf, e I. Valera. A survey of algorithmic recourse: contrastive explanations and counterfactuals. ACM Computing Surveys (CSUR), 55(5): 1–29, 2022.
K. Khan, W. Ahmad, M. N. Amin, e A. Ahmad. A systematic review of the research development on the application of machine learning for concrete. Materials, 15(13): 4512, 2022. DOI: 10.3390/ma15134512.
M. Kraus, A. Baumann, e S. Feuerriegel. Algorithmic counterfactual explanations for robustness, transparency and accountability in predictive decision-making. European Journal of Operational Research, 282(1):92–105, 2020. DOI: 10.1016/j.ejor.2019.09.040. URL [link].
G. Lemaı̂tre, F. Nogueira, e C. K. Aridas. Imbalanced-learn: A python toolbox to tackle the curse of imbalanced datasets in machine learning. Journal of Machine Learning Research, 18(17):1–5, 2017.
M. R. Marcolino et al. Análise preditiva do desempenho acadêmico em ambientes virtuais de aprendizagem: uma abordagem com aprendizado de máquina otimizado. 2025.
M. Medvedeva, M. Wieling, e M. Vols. Rethinking the field of automatic prediction of court decisions. Artificial Intelligence and Law, 31(1):195–212, 2022. DOI: 10.1007/s10506-021-09306-3.
R. K. Mothilal, A. Sharma, e C. Tan. Explaining machine learning classifiers through diverse counterfactual explanations. In Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency (FAT*), pages 607–617. ACM, 2020. DOI: 10.1145/3351095.3372850. URL [link].
S. Musman, V. M. d. A. Passos, I. B. R. Silva, e S. M. Barreto. Avaliação de um modelo de predição para apneia do sono em pacientes submetidos a polissonografia. Jornal Brasileiro de Pneumologia, 37:75–84, 2011.
F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, J. Vanderplas, A. Passos, D. Cournapeau, M. Brucher, M. Perrot, e E. Duchesnay. Scikit-learn: Machine learning in python. Journal of Machine Learning Research, 12:2825–2830, 2011.
D. J. M. Reddy, S. Regella, e S. R. Seelam. Recruitment prediction using machine learning. In 2020 5th international conference on computing, communication and security (ICCCS), pages 1–4. IEEE, 2020.
C. Rudin. Stop explaining black box machine learning models for high stakes decisions and use interpretable models instead. Nature Machine Intelligence, 2019.
W. Samek, G. Montavon, A. Vedaldi, L. K. Hansen, e K.-R. Müller. Explainable artificial intelligence: Interpreting, explaining and visualizing deep learning. Cognitive Computation, 2023. DOI: 10.1007/s12559-023-10179-8.
A. Selbst et al. Fairness and abstraction in sociotechnical systems. Proceedings of the Conference on Fairness, Accountability, and Transparency, 2019.
B. Shahriari, K. Swersky, Z. Wang, R. P. Adams, e N. De Freitas. Taking the human out of the loop: A review of bayesian optimization. Proceedings of the IEEE, 104(1): 148–175, 2016.
J. J. d. D. d. Silva. Interpretabilidade de modelos de aprendizado de máquina: uma abordagem baseada em árvores de decisão. 2023.
S. M. Sinhorinho e A. T. M. S. de Moura. Uso de disciplina violenta na infância: percepções e práticas na estratégia saúde da família. Revista Brasileira de Medicina de Família e Comunidade, 17(44):2835–2835, 2022.
UNICEF. Violent discipline. Technical report, UNICEF MENA Regional Office, 2019. URL [link].
S. Wachter, B. Mittelstadt, e C. Russell. Counterfactual explanations without opening the black box: Automated decisions and the gdpr. Harvard journal of law technology, 31: 841–887, 04 2018. DOI: 10.2139/ssrn.3063289.
K. P. Ward, S. J. Lee, A. C. Grogan-Kaylor, J. Ma, e G. T. Pace. Patterns of caregiver aggressive and nonaggressive discipline toward young children in low- and middle-income countries: A latent class approach. Child Abuse Neglect, 128:105606, 2022. URL [link].
