Lidando com o Desbalanceamento em Problemas de Classificação Hierárquica com Reamostragem de Dados

  • Rodolfo Miranda Pereira PUCPR
  • Yandre M. G. Costa UEM
  • Carlos N. Silla Jr. PUCPR

Resumo


Muitos problemas de classificação importantes são desbalanceados. Embora as abordagens de reamostragem sejam uma solução comum para diferentes tipos de problemas de classificação, elas ainda não foram definidas para problemas de classificação hierárquica. O objetivo deste trabalho é propor novas abordagens de reamostragem para lidar com a questão do desbalanceamento de classes em problemas de classificação hierárquica. Quatro direções foram investigadas: (i) O uso de métodos clássicos de reamostragem; (ii) Uma estratégia de conversão de caminho de rótulo; (iii) Esquemas para usar algoritmos de reamostragem com abordagens locais; (iv) impactos da Algoritmos de reamostragem globais. Para mostrar os contribuição deste trabalho, foi investigado o problema do desbalanceamento na identificação do COVID-19 em radiografias de tórax.

Referências

Mangolin, R. B., Pereira, R. M., Britto Jr., A. S., Silla Jr, C. N., Feltrim, V. D., Gonçalves, D. B., Costa, Y. M. G. (2020) A multimodal approach for multi-label movie genre classification. Multimedia Tools and Applications, pages 1-26.

Pereira, R. M., Bertolini, D., Teixeira, L. O., Silla Jr., C. N., Costa, Y. M. G. (2020a). COVID-19 identification in chest X-ray images on flat and hierarchical classification scenarios. Computer Methods and Programs in Biomedicine, 194(C):1-18.

Pereira, R. M., Costa, Y. M. G., Aguiar, R. L., Britto, A. S., Oliveira, L. E. S., Silla Jr., C. N. (2019). Representation Learning vs. Handcrafted Features for Music Genre Classification. In: Intl. Joint Conference on Neural Networks, pages 1-8.

Pereira, R. M., Costa, Y. M. G., Silla Jr, C. N. (2018). Dealing with Imbalanceness in Hierarchical Multi-Label Datasets Using Multi-Label Resampling Techniques. In: Intl. Conference on Tools with Artificial Intelligence, pages 818-826.

Pereira, R. M., Costa, Y. M. G., Silla Jr, C. N. (2020b). MLTL: A multi-label approach for the Tomek Link undersampling algorithm. Neurocomputing, 383(C): 95-105.

Pereira, R. M., Costa, Y. M. G., Silla Jr, C. N. (2021). Handling imbalance in hierarchical classification problems using local classifiers approaches. Data Mining and Knowledge Discovery, 1-58.

Pereira, R. M.; Silla Jr, C. N. (2017). Using simplified chords sequences to classify songs genres. In: Intl Conference on Multimedia and Expo, pages 1446-1451.

Valério, V. D., Pereira, R. M., Costa, Y. M. G., Gonçalves, D. B., Silla Jr, C. N. (2018). A Resampling Approach for Imbalanceness on Music Genre Classification using Spectrograms. In: Florida A.I. Research Society Conf., pages 500-505.
Publicado
15/06/2021
Como Citar

Selecione um Formato
PEREIRA, Rodolfo Miranda; COSTA, Yandre M. G.; SILLA JR., Carlos N.. Lidando com o Desbalanceamento em Problemas de Classificação Hierárquica com Reamostragem de Dados. In: CONCURSO DE TESES E DISSERTAÇÕES - SIMPÓSIO BRASILEIRO DE COMPUTAÇÃO APLICADA À SAÚDE (SBCAS), 21. , 2021, Evento Online. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2021 . p. 13-18. ISSN 2763-8987. DOI: https://doi.org/10.5753/sbcas.2021.16094.