Predição de ações judiciais de consumo não registrado: uma abordagem para o problema de classes desbalanceadas
Resumo
Ajudar empresas a prever os consumidores que podem ser levados à justiça contra as mesmas não é uma tarefa simples. Um dos principais problemas é a quantidade de dados dessas empresas, aliada a grande desproporção entre as classes. Assim, o objetivo deste trabalho ´e prever processos judiciais de consumo de energia não registrados para uma companhia de energia elétrica que tenha uma base de dados com mais de 2 milh˜oes de clientes e uma raz˜ao de 1:174 de desequilíbrio entre as classes. Para isso, propomos um método incremental que utiliza técnicas de amostragem. Os resultados obtidos por esse método foram 97,07 de sensibilidade.
Referências
Buckman, J., Roy, A., Raffel, C., and Goodfellow, I. (2018). Thermometer encoding: One hot way to resist adversarial examples.
Chawla, N. V., Bowyer, K. W., Hall, L. O., and Kegelmeyer, W. P. (2002). Smote: synthetic minority over-sampling technique. Journal of artificial intelligence research, 16:321–357.
Chen, T. and Guestrin, C. (2016). Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, pages 785–794. ACM.
Elrahman, S. M. A. and Abraham, A. (2013). A review of class imbalance problem. Journal of Network and Innovative Computing, 1(2013):332–340.
Hochreiter, S. and Schmidhuber, J. (1997). Long short-term memory. Neural computation, 9(8):1735–1780.
Hosmer Jr, D. W., Lemeshow, S., and Sturdivant, R. X. (2013). Applied logistic regression, volume 398. John Wiley & Sons.
Ib´a˜nez, V. A., Hartmann, P., and Calvo, P. Z. (2006). Antecedents of customer loyalty in residential energy markets: Service quality, satisfaction, trust and switching costs. The Service Industries Journal, 26(6):633–650.
Manevitz, L. M. and Yousef, M. (2001). One-class svms for document classification. Journal of machine Learning research, 2(Dec):139–154.
Mohri, M., Rostamizadeh, A., and Talwalkar, A. (2018). Foundations of machine learning. MIT press.
Tan, P.-N. (2018). Introduction to data mining. Pearson Education India.