Caracterização da Mortalidade Infantil dos Estados de Santa Catarina e Amapá Utilizando Mineração de Dados

  • Wanderson L. G. Soares PUC-MG
  • Patrícia Lima PUC-MG
  • Luis E. Zárate PUC-MG
  • Mark A. Junho Song PUC-MG
  • Cristiane N. Nobre PUC-MG

Resumo


The objective of this article is to use the concepts of knowledge discovery in databases, specifically the concepts of machine learning in the data mining phase, to characterize infant mortality in the state of Santa Catarina (with lower infant mortality rate) and in the state of Amapá (with the highest infant mortality rate). In this way, the classifiers J48, JRip and Random Forest were used and a brief comparison was made between the results obtained by the classifiers in both states. In addition, the database was preprocessed, which includes attribute selection and balancing, the application of data mining techniques and the analysis of the results of the respective models.
Palavras-chave: Classification, Data Mining, Infant Mortality, Machine Learning

Referências

Barbas, D. d. S., Costa, A. J. L., Luiz, R. R., and Kale, P. L. Determinantes do peso insuficiente e do baixo peso ao nascer na cidade do rio de janeiro, brasil, 2001. Epidemiologia e Serviços de Saúde 18 (2): 161–170, 2009.

Barcellos, C. d. C., Ramalho, W. M., et al. Situação atual do geoprocessamento e da análise de dados espaciais em saúde no brasil, 2002.

Black, R. E., Cousens, S., Johnson, H. L., Lawn, J. E., Rudan, I., Bassani, D. G., Jha, P., Campbell, H., Walker, C. F., Cibulskis, R., et al. Global, regional, and national causes of child mortality in 2008: a systematic analysis. The lancet 375 (9730): 1969–1987, 2010.

Brasil, M. d. S. Manual de vigilância do óbito infantil e fetal e do comitê de prevenção do óbito infantil e fetal, 2009.

Breiman, L. Random forests. Machine learning 45 (1): 5–32, 2001.

Carvalho, A., Faceli, K., LORENA, A., and GAMA, J. Inteligência artificial–uma abordagem de aprendizado de máquina. Rio de Janeiro: LTC, 2011.

Cohen, W. W. Fast effective rule induction. In Machine Learning Proceedings 1995. Elsevier, pp. 115–123, 1995.

Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. The kdd process for extracting useful knowledge from volumes of data. Communications of the ACM 39 (11): 27–34, 1996.

Felix, L. C. M. Data mining no processo de extraçao de conhecimento de bases de dados. Ph.D. thesis, Universidade de São Paulo, 1998.

Goldani, M. Z., Barbieri, M. A., Bettiol, H., Barbieri, M. R., and Tomkins, A. Infant mortality rates according to socioeconomic status in a Brazilian city. Revista de Saúde Pública vol. 35, pp. 256 – 261, 06, 2001.

Hernandez, A. R., Silva, C. H. d., Agranonik, M., Quadros, F. M. d., and Goldani, M. Z. Análise de tendências das taxas de mortalidade infantil e de seus fatores de risco na cidade de porto alegre, rio grande do sul, Brasil, no período de 1996 a 2008. Cadernos de Saúde Pública vol. 27, pp. 2188–2196, 2011.

Khoshgoftaar, T. M., Golawala, M., and Van Hulse, J. An empirical study of learning from imbalanced data using random forest. vol. 2, pp. 310–317, 2007.

Kitsantas, P., Hollander, M., and Li, L. Using classification trees to assess low birth weight outcomes. Artificial intelligence in medicine 38 (3): 275–289, 2006.

Kohavi, R. et al. A study of cross-validation and bootstrap for accuracy estimation and model selection. In Ijcai. Vol. 14. Montreal, Canada, pp. 1137–1145, 1995.

Oliveira, I. T. C. d. et al. Aplicação de data mining na busca de um modelo de prevenção da mortalidade infantil, 2001.

Prati, R. C., Batista, G., and Monard, M. C. Uma experiência no balanceamento artificial de conjuntos de dados para aprendizado com classes desbalanceadas utilizando análise roc. In Proc. of the Workshop on Advances & Trends in AI for Problem Solving. Vol. 1. pp. 28–33, 2003.

Quilici-Gonzalez, José Artur de Assis Zampirolli, F. Sistemas inteligentes e mineração de dados, 2015.

Quinlan, J. R. C4. 5: programs for machine learning. Elsevier, 2014.

UNICEF, N. B. et al. Disponível em: http://www.unicef.org/brazil/pt/. Acesso em: junho de 2018, 2008.

Vianna, R. C. X. F., Moro, C. M. C. d. B., Moysés, S. J., Carvalho, D., and Nievola, J. C. Mineração de dados e características da mortalidade infantil. Cadernos de Saúde Pública vol. 26, pp. 535–542, 2010.
Publicado
22/10/2018
SOARES, Wanderson L. G.; LIMA, Patrícia; ZÁRATE, Luis E.; SONG, Mark A. Junho; NOBRE, Cristiane N.. Caracterização da Mortalidade Infantil dos Estados de Santa Catarina e Amapá Utilizando Mineração de Dados. In: SYMPOSIUM ON KNOWLEDGE DISCOVERY, MINING AND LEARNING (KDMILE), 6. , 2018, São Paulo/SP. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . p. 129-136. ISSN 2763-8944. DOI: https://doi.org/10.5753/kdmile.2018.27394.