Predição de ações judiciais de consumo não registrado: uma abordagem para o problema de classes desbalanceadas

  • Paulo R. Gomes UFMA
  • Dayvson W. Almeida UFMA
  • Nelia C. Reis UFMA
  • João V. Franca UFMA
  • Pedro T. Santos UFMA
  • José Sobral Neto Equatorial Energia
  • Erika W. Alves Equatorial Energia
  • Milton S. Oliveira Equatorial Energia

Resumo


Ajudar empresas a prever os consumidores que podem ser levados à justiça contra as mesmas não é uma tarefa simples. Um dos principais problemas é a quantidade de dados dessas empresas, aliada a grande desproporção entre as classes. Assim, o objetivo deste trabalho ´e prever processos judiciais de consumo de energia não registrados para uma companhia de energia elétrica que tenha uma base de dados com mais de 2 milh˜oes de clientes e uma raz˜ao de 1:174 de desequilíbrio entre as classes. Para isso, propomos um método incremental que utiliza técnicas de amostragem. Os resultados obtidos por esse método foram 97,07 de sensibilidade.

Palavras-chave: Predição, consumo de energia, consumidores não regeistrados

Referências

Breiman, L. (2001). Random forests. Machine learning, 45(1):5–32.

Buckman, J., Roy, A., Raffel, C., and Goodfellow, I. (2018). Thermometer encoding: One hot way to resist adversarial examples.

Chawla, N. V., Bowyer, K. W., Hall, L. O., and Kegelmeyer, W. P. (2002). Smote: synthetic minority over-sampling technique. Journal of artificial intelligence research, 16:321–357.

Chen, T. and Guestrin, C. (2016). Xgboost: A scalable tree boosting system. In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, pages 785–794. ACM.

Elrahman, S. M. A. and Abraham, A. (2013). A review of class imbalance problem. Journal of Network and Innovative Computing, 1(2013):332–340.

Hochreiter, S. and Schmidhuber, J. (1997). Long short-term memory. Neural computation, 9(8):1735–1780.

Hosmer Jr, D. W., Lemeshow, S., and Sturdivant, R. X. (2013). Applied logistic regression, volume 398. John Wiley & Sons.

Ib´a˜nez, V. A., Hartmann, P., and Calvo, P. Z. (2006). Antecedents of customer loyalty in residential energy markets: Service quality, satisfaction, trust and switching costs. The Service Industries Journal, 26(6):633–650.

Manevitz, L. M. and Yousef, M. (2001). One-class svms for document classification. Journal of machine Learning research, 2(Dec):139–154.

Mohri, M., Rostamizadeh, A., and Talwalkar, A. (2018). Foundations of machine learning. MIT press.

Tan, P.-N. (2018). Introduction to data mining. Pearson Education India.
Publicado
25/09/2019
GOMES, Paulo R.; ALMEIDA, Dayvson W.; REIS, Nelia C.; FRANCA, João V.; SANTOS, Pedro T.; SOBRAL NETO, José; ALVES, Erika W.; OLIVEIRA, Milton S.. Predição de ações judiciais de consumo não registrado: uma abordagem para o problema de classes desbalanceadas. In: ESCOLA REGIONAL DE COMPUTAÇÃO DO CEARÁ, MARANHÃO E PIAUÍ (ERCEMAPI), 7. , 2019, São Luís/MA. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2019 . p. 158-165.