Seleção customizada de classificadores e oportunidades para paralelismo

  • Paulo Henrique da Silva UFG
  • Wellington S. Martins UFG
  • Thierson Couto Rosa UFG

Resumo


A classificação automática de documentos (ADC) é considerada uma das tarefas mais relevantes e desafiadoras no contexto de recuperação de informações, devido a alta dimensionalidade e esparsidade dos dados. Alguns trabalhos defendem o uso da seleção dinâmica do classificador para melhorar a acurácia desta tarefa. Este trabalho propõe a seleção customizada de método de classificação realizada em tempo de consulta (teste), bem como a exploração de paralelismo para acelerar a tarefa de ADC. Resultados experimentais, utilizando bases de dados padronizadas, mostram resultados competitivos e promissores nas aplicações, e novas oportunidades para exploração de paralelismo.
Palavras-chave: Classificação de documentos, seleção automática, paralelismo

Referências

Britto Jr, A. S., Sabourin, R., and Oliveira, L. E. (2014). Dynamic selection of classifiers—a comprehensive review. Pattern recognition, 47(11):3665–3680.

Cruz, R. M., Sabourin, R., and Cavalcanti, G. D. (2018). Dynamic classifier selection: Recent advances and perspectives. Information Fusion, 41:195–216.

Devlin, J., Chang, M.-W., Lee, K., and Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint:1810.04805.

Mendes, L. F., e. a. (2020). "keep it simple, lazy"– metalazy: a new metastrategy for lazy text classification. Conference on Information and Knowledge Management – CIKM.

Team, R. D. (2018). RAPIDS: Collection of Libraries for End to End GPU Data Science.
Publicado
14/09/2020
DA SILVA, Paulo Henrique; MARTINS, Wellington S.; ROSA, Thierson Couto. Seleção customizada de classificadores e oportunidades para paralelismo. In: ESCOLA REGIONAL DE ALTO DESEMPENHO DO CENTRO-OESTE (ERAD-CO), 3. , 2020, Campo Grande. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2020 . p. 9-12. DOI: https://doi.org/10.5753/eradco.2020.12645.