Aplicação de Mineração de Dados para Predição de Mortalidade em UTI: balanceamento, dados ausentes e classificadores
Resumo
Escores de severidade fornecem um índice consolidado do estado de saúde do paciente na UTI. Estes escores são baseados em modelos lineares e em análises das variáveis isoladamente. Trabalhos prévios aplicaram mineração de dados para indução de modelos mais complexos de predição, mas não se aprofundaram na análise do desbalanceamento de classes e tratamento dos dados ausentes. Este trabalho analisou técnicas de balanceamento e imputação de valores, em conjunto com modelos de classificação de Random Forest (RF), Redes Neurais Artificiais (RNA) e Regressão Logística (RL). Como resultado a RF obteve o melhor desempenho, com a AUC média de 0.7840.006, sensibilidade de 0.7380.002 e especificidade de 0.7000.003 com valores ausentes substituídos por valores padrões e treinada com a base com sub-amostragem NCL.
Referências
Chawla, N. V., Bowyer, K. W., Hall, L. O., and Kegelmeyer, W. P. (2002). Smote: synthetic minority over-sampling technique. Journal of artificial intelligence research, 16:321–357.
Johnson, A. E., Pollard, T. J., Shen, L., Lehman, L.-w. H., Feng, M., Ghassemi, M., Moody, B., Szolovits, P., Celi, L. A., and Mark, R. G. (2016). Mimic-iii, a freely accessible critical care database. Scientific data, 3.
Kim, S., Kim, W., and Park, R. W. (2011). A comparison of intensive care unit mortality prediction models through the use of data mining techniques. Healthcare informatics
research, 17(4):232–243.
Knaus, W. A., Wagner, D. P., Draper, E. A., Zimmerman, J. E., Bergner, M., Bastos, P. G., Sirio, C. A., Murphy, D. J., Lotring, T., Damiano, A., et al. (1991). The apache iii prognostic system: risk prediction of hospital mortality for critically iii hospitalized adults. Chest, 100(6):1619–1636.
Knaus, W. A., Zimmerman, J. E., Wagner, D. P., Draper, E. A., and Lawrence, D. E. (1981). Apache-acute physiology and chronic health evaluation: a physiologically based classification system. Critical care medicine, 9(8):591–597.
Laurikkala, J. (2001). Improving identification of difficult small classes by balancing class distribution. In Conference on Artificial Intelligence in Medicine in Europe, pages 63–
66. Springer.
Schmidt, D., da Silva, D. B., da Costa, C. A., and da Rosa Righi, R. (2018). Um modelo de predição de mortalidade em unidades de terapia intensiva baseado em deep learning. In 18o Simp´osio Brasileiro de Computac¸ ˜ao Aplicada `a Sa´ude (SBCAS 2018), volume 18, Porto Alegre, RS, Brasil. SBC.
Silva, I., Moody, G., Scott, D. J., Celi, L. A., and Mark, R. G. (2012). Predicting inhospital mortality of icu patients: The physionet/computing in cardiology challenge 2012. In Computing in Cardiology (CinC), 2012, pages 245–248. IEEE.
Xia, H., Daley, B. J., Petrie, A., and Zhao, X. (2012). A neural network model for mortality prediction in icu. In 2012 Computing in Cardiology, pages 261–264. IEEE.