Exploring conditional missing patterns for automated bacteria identification using MALDI-TOF MS data

  • J. C. F. da Rocha UEPG
  • A. Campos Jr. UEPG
  • R. M. Etto UEPG
  • C. W. Galvão UEPG
  • G. L. Fedacz UEPG
  • R. R. da Silva UEPG
  • A. S. S. Oliveira UEPG


A aprendizagem de classificadores para identificação automática de bactérias a partir fingerprints de espectrometria MALDI-TOF requer o tratamento de conjuntos de dados incompletos cuja ausência dos dados é condicional à hipótese de classificação (CMP). CMP é um padrão de perda não-aleatória (MNAR) que fornece evidencias para classificação. Uma estratégia para tratar o CMP é aplicar a estratificação de características. Considerando isto, este trabalho avaliou a eficácia da estratificação no treinamento de classificadores naive Bayes com a realização de dois experimentos. O primeiro, comparou o desempenho preditivo de classificadores categóricos, treinados sobre dados estratificados, com o desempenho de classificadores Gaussianos treinados em dados previamente imputados. O segundo experimento estimou o impacto do desbalanceamento de classe na diferença dos desempenhos dos classificadores Gaussianos e categóricos. Os resultados da ANOVA sugere que a estratificação de características induz a aprendizagem de classificadores mais acurados. A análise de correlção mostrou que o desbalanceamento de classes teve pouca influência sobre a diferença no desempenho dos classificadores.


ROCHA, J. C. F. da; CAMPOS JR., A.; ETTO, R. M.; GALVÃO, C. W.; FEDACZ, G. L.; SILVA, R. R. da; OLIVEIRA, A. S. S.. Exploring conditional missing patterns for automated bacteria identification using MALDI-TOF MS data. In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA (SBIAGRO), 14. , 2023, Natal/RN. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 222-229. ISSN 2177-9724. DOI: https://doi.org/10.5753/sbiagro.2023.26562.