Aplicação de Mineração de Dados para Predição de Mortalidade em UTI: balanceamento, dados ausentes e classificadores

  • Jorge S. A. M. Barreto UEFS
  • Angelo C. Loula UEFS

Resumo


Escores de severidade fornecem um ı́ndice consolidado do estado de saúde do paciente na UTI. Estes escores são baseados em modelos lineares e em análises das variáveis isoladamente. Trabalhos prévios aplicaram mineração de dados para indução de modelos mais complexos de predição, mas não se aprofundaram na análise do desbalanceamento de classes e tratamento dos da- dos ausentes. Este trabalho analisou técnicas de balanceamento e imputação de valores, em conjunto com modelos de classificação de Random Forest (RF), Redes Neurais Artificiais (RNA) e Regressão Logı́stica (RL). Como resultado a RF obteve o melhor desempenho, com a AUC média de 0.784±0.006, sensibi- lidade de 0.738±0.002 e especificidade de 0.700±0.003 com valores ausentes substituı́dos por valores padrões e treinada com a base com sub-amostragem NCL.

Palavras-chave: UTI, mortalidade, mineração de dados, balanceamento, dados ausentes, classificação

Referências

Azur, M. J., Stuart, E. A., Frangakis, C., and Leaf, P. J. (2011). Multiple imputation by chained equations: what is it and how does it work? International journal of methods in psychiatric research, 20(1):40–49.

Chawla, N. V., Bowyer, K. W., Hall, L. O., and Kegelmeyer, W. P. (2002). Smote: synthetic minority over-sampling technique. Journal of artificial intelligence research, 16:321–357.

Johnson, A. E., Pollard, T. J., Shen, L., Lehman, L.-w. H., Feng, M., Ghassemi, M., Moody, B., Szolovits, P., Celi, L. A., and Mark, R. G. (2016). Mimic-iii, a freely accessible critical care database. Scientific data, 3.

Kim, S., Kim, W., and Park, R. W. (2011). A comparison of intensive care unit mortality prediction models through the use of data mining techniques. Healthcare informatics research, 17(4):232–243.

Knaus, W. A., Wagner, D. P., Draper, E. A., Zimmerman, J. E., Bergner, M., Bastos, P. G., Sirio, C. A., Murphy, D. J., Lotring, T., Damiano, A., et al. (1991). The apache iii prognostic system: risk prediction of hospital mortality for critically iii hospitalized adults. Chest, 100(6):1619–1636.

Knaus, W. A., Zimmerman, J. E., Wagner, D. P., Draper, E. A., and Lawrence, D. E. (1981). Apache-acute physiology and chronic health evaluation: a physiologically based classification system. Critical care medicine, 9(8):591–597.

Laurikkala, J. (2001). Improving identification of difficult small classes by balancing class distribution. In Conference on Artificial Intelligence in Medicine in Europe, pages 63– 66. Springer.

Schmidt, D., da Silva, D. B., da Costa, C. A., and da Rosa Righi, R. (2018). Um modelo de predição de mortalidade em unidades de terapia intensiva baseado em deep learning. In 18 o Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS 2018), volume 18, Porto Alegre, RS, Brasil. SBC.

Silva, I., Moody, G., Scott, D. J., Celi, L. A., and Mark, R. G. (2012). Predicting in- hospital mortality of icu patients: The physionet/computing in cardiology challenge 2012. In Computing in Cardiology (CinC), 2012, pages 245–248. IEEE.

Xia, H., Daley, B. J., Petrie, A., and Zhao, X. (2012). A neural network model for mortality prediction in icu. In 2012 Computing in Cardiology, pages 261–264. IEEE.
Publicado
24/06/2019
Como Citar

Selecione um Formato
BARRETO, Jorge S. A. M.; LOULA, Angelo C.. Aplicação de Mineração de Dados para Predição de Mortalidade em UTI: balanceamento, dados ausentes e classificadores. In: BRAZILIAN E-SCIENCE WORKSHOP (BRESCI), 13. , 2019, Belém. Anais do XIII Brazilian e-Science Workshop. Porto Alegre: Sociedade Brasileira de Computação, june 2019 . p. 9-16.