Credit Score: Proposal of a Multi-Source Intelligent System for Predictive Credit Analysis

  • Bernardo Dirceu Tomasi IFSul
  • João Mário Lopes Brezolin IFSul

Resumo


O cenário econômico brasileiro é caracterizado pela alta inadimplência e taxas de juros elevadas. Nesse contexto destaca-se o endividamento por cartões de crédito. Este estudo propõe modelos de classificação e um sistema de pontuação para identificar clientes com propensão à inadimplência a partir de uma análise comportamental. O processo envolveu o desenvolvimento de um sistema de pontuação para cartões de crédito, usando três conjuntos de dados distintos. Os modelos obtiveram AUC-ROC de 88%, 84% e 70% respectivamente. Os dados obtidos pelo sistema de classificação foram utilizados para alimentar o sistema de pontuação que realiza a ponderação entre as probabilidades de inadimplência dos diferentes conjuntos de dados. Os resultados obtidos foram considerados adequados, uma vez que os modelos de previsão demonstraram capacidade de distinguir entre as classes, e o sistema de pontuação dinâmico e multifonte mostrou-se apto para realizar a previsão do comportamento dos clientes.
Palavras-chave: Ciência de Dados, Pontuação de Crédito, Aprendizado de Máquina, Inteligência Artificial

Referências

Ali, P. J. M., Faraj, R. H., Koya, E., Ali, P. J. M., and Faraj, R. H. (2014). Data normalization and standardization: a technical report. Mach Learn Tech Rep, 1(1):1–6.

Anowar, F., Sadaoui, S., and Selim, B. (2021). Conceptual and empirical comparison of dimensionality reduction algorithms (pca, kpca, lda, mds, svd, lle, isomap, le, ica, t-sne). Computer Science Review, 40:100378.

Bernanke, B. S., Lown, C. S., and Friedman, B. M. (1991). The credit crunch. Brookings papers on economic activity, 1991(2):205–247.

Blagus, R. and Lusa, L. (2013). Smote for high-dimensional class-imbalanced data. BMC bioinformatics, 14:1–16.

Bonaccorso, G. (2018). Machine Learning Algorithms: Popular algorithms for data science and machine learning. Packt Publishing Ltd.

Brito, G. A. S. and Assaf Neto, A. (2008). Modelo de classificação de risco de crédito de empresas. Revista Contabilidade Finanças, 19(46):18–29.

Feldmann, P. (2023). É a alta taxa de juros que prejudica o país. Jornal USP, 2023. Disponível em: [link]. Acesso em: 28 de Set. de 2023.

Gahlaut, A., Singh, P. K., et al. (2017). Prediction analysis of risky credit using data mining classification models. In 2017 8th International Conference on Computing, Communication and Networking Technologies (ICCCNT), pages 1–7. IEEE.

Ge, D., Gu, J., Chang, S., and Cai, J. (2020). Credit card fraud detection using lightgbm model. In 2020 International Conference on E-Commerce and Internet Technology (ECIT), pages 232–236.

Johnson, B. (2023). Credit scoring models 101: Types and examples for a stronger financial future. AVP, Global Enablement, 2023. Disponível em: [link]. Acesso em: 28 de Set. de 2023.

Kalton, G. and Kish, L. (1981). Two efficient random imputation procedures. In Proceedings of the survey research methods section, pages 146–151. American Statistical Association.

Kosaraju, N., Sankepally, S. R., and Mallikharjuna Rao, K. (2023). Categorical data: Need, encoding, selection of encoding method and its emergence in machine learning models—a practical review study on heart disease prediction dataset using pearson correlation. In Proceedings of International Conference on Data Science and Applications: ICDSA 2022, Volume 1, pages 369–382. Springer.

Nascimento, A. (2023). Quatro em cada 10 brasileiros têm dívidas no rotativo do cartão de crédito. O Tempo, 2023. Disponível em: [link]. Acesso em: 20 de Jun. de 2023.

Neto, R. C. (2023). Comissão de assuntos econômicos ouve presidente do banco central – 25/4/23. TV Senado, 2023. Disponível em: [link]. Acesso em: 25 de abril de 2023.

Nonato, C. T. (2022). Machine learning aplicado na concessão de crédito: estudo comparativo. Master’s thesis, Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Acesso em: 17 maio 2024.

Piaia, C. F. et al. (2008). Finanças pessoais e independência financeira: a educação e organização financeira como instrumentos de melhoria na vida das pessoas.

Ray, S. (2019). A quick review of machine learning algorithms. In 2019 International conference on machine learning, big data, cloud and parallel computing (COMITCon), pages 35–39. IEEE.

SERASA (2024). Mapa da inadimplência e negociação de dívidas no brasil. Disponível em: [link]. Acesso em: 6 de agosto de 2024.

Silva, H., Silva, R., and Porto, F. (2021). Sagad: Synthetic data generator for tabular datasets. In Anais do XXXVI Simpósio Brasileiro de Bancos de Dados, pages 1–12, Porto Alegre, RS, Brasil. SBC.

Silva Neto, V. J. d., Bonacelli, M. B. M., and Pacheco, C. A. (2020). O sistema tecnológico digital: inteligência artificial, computação em nuvem e big data. Revista Brasileira de Inovação, 19:e0200024.

Tanimoto, A., Yamada, S., Takenouchi, T., Sugiyama, M., and Kashima, H. (2022). Improving imbalanced classification using near-miss instances. Expert Systems with Applications, 201:117130.

Wang, H. (2023). Engenheiro de algoritmo. LinkedIn, 2023. Disponível em: [link]. Acesso em: 16 de Jun. de 2023.

Yin, Y., Jang-Jaccard, J., Xu, W., Singh, A., Zhu, J., Sabrina, F., and Kwak, J. (2023). Igrf-rfe: a hybrid feature selection method for mlp-based network intrusion detection on unsw-nb15 dataset. Journal of Big data, 10(1):15.

Zanatta, P. and Nassif, T. (2023). Queda de investimentos, menos crédito e desemprego: os efeitos negativos dos juros altos para a economia. CNN Brasil, 2023. Disponível em: [link]. Acesso em: 28 de Set. de 2023.

Zowasel (2023). The future of alternative credit scoring for digital banks. Medium, 2023. Disponível em: [link]. Acesso em: 28 de Set. de 2023.
Publicado
17/11/2024
TOMASI, Bernardo Dirceu; BREZOLIN, João Mário Lopes. Credit Score: Proposal of a Multi-Source Intelligent System for Predictive Credit Analysis. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 21. , 2024, Belém/PA. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2024 . p. 85-96. ISSN 2763-9061. DOI: https://doi.org/10.5753/eniac.2024.245097.