Classificação Multirrótulo com Mapas de Kohonen e Vizinhanças Vencedoras
Resumo
O problema convencional de classificação no contexto do aprendizado de máquina consiste em classificar exemplos de conjuntos de dados em categorias pré-definidas, de acordo com uma ou mais características semelhantes. Contudo, alguns conjuntos de dados possuem classes com intersecções, ou seja, exemplos podem pertencer a mais de uma classe simultaneamente. Exemplos desses problemas podem ser encontrados, por exemplo, na identificação de gêneros de livros e na classificação de imagens. Esses tipos de problemas são denominados multirrótulo. O objetivo deste artigo é propor um novo método de classificação multirrótulo com Mapas de Kohonen. A ideia é utilizar o neurônio vencedor do processo competitivo do mapa auto-organizável, juntamente com a vizinhança ao redor desse neurônio, para a classificação de dados. Assim, um novo exemplo é classificado nas classes pertencentes aos exemplos de treino mapeados para o neurônio vencedor e sua vizinhança. A linguagem Python e a biblioteca de aprendizado de máquina Scikit-Learn foram utilizadas para implementação do modelo da rede neural, para implementação das medidas de avaliação, e para a geração de conjuntos de dados sintéticos. A utilização de uma vizinhança de neurônios foi comparada com uma proposta anterior utilizando apenas um neurônio vencedor. Os resultados mostraram que a utilização de uma vizinhança ao redor do neurônio vencedor é promissora, obtendo melhores resultados.
Palavras-chave:
aprendizado de máquina, classificação, classification, machine learning, mapas de kohonen, multilabel, multirrótulo, neural networks, redes neurais, self-organizing maps
Referências
Borges, H. and Nievola, J. Multi-label hierarchical classification using a competitive neural network for protein function prediction. In International Joint Conference on Neural Networks. pp. 1–8, 2012.
Cerri, R., Barros, R. C., P. L. F. de Carvalho, A. C., and Jin, Y. Reduction strategies for hierarchical multi-label classification in protein function prediction. BMC Bioinformatics 17 (1): 373, Sep, 2016.
Colombini, G. G., de Abreu, I. B. M., and Cerri, R. A self-organizing map-based method for multi-label classification. In Neural Networks (IJCNN), 2017 International Joint Conference on. IEEE, pp. 4291–4298, 2017.
Godbole, S. and Sarawagi, S. Discriminative methods for multi-labeled classification. In Pacific-Asia conference on knowledge discovery and data mining. Springer, pp. 22–30, 2004.
Mao, J., Huang, J., Toshev, A., Camburu, O., Yuille, A. L., and Murphy, K. Generation and comprehension of unambiguous object descriptions. In Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 11–20, 2016.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. Scikit-learn: Machine learning in Python. Journal of Machine Learning Research vol. 12, pp. 2825–2830, 2011.
Tsoumakas, G., Katakis, I., and Vlahavas, I. Mining multi-label data. In Data mining and knowledge discovery handbook. Springer, pp. 667–685, 2009.
Wehrmann, J., Barros, R. C., Dôres, S. N. d., and Cerri, R. Hierarchical multi-label classification with chained neural networks. In Proceedings of the Symposium on Applied Computing. SAC ’17. ACM, New York, NY, USA, pp. 790–795, 2017.
Wehrmann, J., Cerri, R., and Barros, R. Hierarchical multi-label classification networks. In Proceedings of the 35th International Conference on Machine Learning, J. Dy and A. Krause (Eds.). Proceedings of Machine Learning Research, vol. 80. PMLR, Stockholmsmässan, Stockholm Sweden, pp. 5225–5234, 2018.
Zhang, M.-L. and Zhou, Z.-H. Multilabel neural networks with applications to functional genomics and text categorization. IEEE transactions on Knowledge and Data Engineering 18 (10): 1338–1351, 2006.
Cerri, R., Barros, R. C., P. L. F. de Carvalho, A. C., and Jin, Y. Reduction strategies for hierarchical multi-label classification in protein function prediction. BMC Bioinformatics 17 (1): 373, Sep, 2016.
Colombini, G. G., de Abreu, I. B. M., and Cerri, R. A self-organizing map-based method for multi-label classification. In Neural Networks (IJCNN), 2017 International Joint Conference on. IEEE, pp. 4291–4298, 2017.
Godbole, S. and Sarawagi, S. Discriminative methods for multi-labeled classification. In Pacific-Asia conference on knowledge discovery and data mining. Springer, pp. 22–30, 2004.
Mao, J., Huang, J., Toshev, A., Camburu, O., Yuille, A. L., and Murphy, K. Generation and comprehension of unambiguous object descriptions. In Proceedings of the IEEE conference on computer vision and pattern recognition. pp. 11–20, 2016.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. Scikit-learn: Machine learning in Python. Journal of Machine Learning Research vol. 12, pp. 2825–2830, 2011.
Tsoumakas, G., Katakis, I., and Vlahavas, I. Mining multi-label data. In Data mining and knowledge discovery handbook. Springer, pp. 667–685, 2009.
Wehrmann, J., Barros, R. C., Dôres, S. N. d., and Cerri, R. Hierarchical multi-label classification with chained neural networks. In Proceedings of the Symposium on Applied Computing. SAC ’17. ACM, New York, NY, USA, pp. 790–795, 2017.
Wehrmann, J., Cerri, R., and Barros, R. Hierarchical multi-label classification networks. In Proceedings of the 35th International Conference on Machine Learning, J. Dy and A. Krause (Eds.). Proceedings of Machine Learning Research, vol. 80. PMLR, Stockholmsmässan, Stockholm Sweden, pp. 5225–5234, 2018.
Zhang, M.-L. and Zhou, Z.-H. Multilabel neural networks with applications to functional genomics and text categorization. IEEE transactions on Knowledge and Data Engineering 18 (10): 1338–1351, 2006.
Publicado
22/10/2018
Como Citar
BARBIRATO, J. G. M.; CERRI, R..
Classificação Multirrótulo com Mapas de Kohonen e Vizinhanças Vencedoras. In: SYMPOSIUM ON KNOWLEDGE DISCOVERY, MINING AND LEARNING (KDMILE), 6. , 2018, São Paulo/SP.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2018
.
p. 161-168.
ISSN 2763-8944.
DOI: https://doi.org/10.5753/kdmile.2018.27398.