Detectando Doença de Parkinson - Uma Comparação de Modelos de Aprendizagem de Máquina com Redução de Dimensionalidade Diferencialmente Privada

Manuel Edvar Bento Filho; Maria de Lourdes Maia Silva; Patrícia Vieira da Silva Barros; César Lincoln Cavalcante Mattos; Javam de Castro Machado

doi:10.5753/sbbd.2020.13650

Manuel Edvar Bento Filho Universidade Federal do Ceará
Maria de Lourdes Maia Silva Universidade Federal do Ceará
Patrícia Vieira da Silva Barros Universidade Federal do Ceará
César Lincoln Cavalcante Mattos Universidade Federal do Ceará
Javam de Castro Machado Universidade Federal do Ceará

DOI: https://doi.org/10.5753/sbbd.2020.13650

Resumo

Este artigo visa apresentar uma comparação de modelos de aprendizagem de máquina utilizando duas abordagens de redução de dimensionalidade no pré-processamento dos dados, uma privada e outra não privada. O problema consiste em classificar pacientes como portadores ou não da doença de Parkinson. Modelos foram comparados a partir de suas capacidades em diagnosticar a doença a partir de uma coleta de dados vocais. Os resultados obtidos indicam que os modelos de processo Gaussiano e Random Forest foram as melhores abordagens sem e com restrição de privacidade diferencial, respectivamente.

Palavras-chave: Doença de Parkinson, Redução de Dimensionalidade, Aprendizagem de Máquina, Privacidade Diferencial

Referências

Chaudhuri, K., Sarwate, A., and Sinha, K. (2012). Near-optimal differentially private principal components. In Advances in Neural Information Processing Systems, pages 989–997.

Das, R. (2010). A comparison of multiple classification methods for diagnosis of parkinson disease. Expert Systems with Applications, 37(2): 1568–1572.

Dias, A. E. and Limongi, J. C. P. (2003). Tratamento dos distúrbios da voz na doença de parkinson: o método lee silverman. Arquivos de Neuro-Psiquiatria, 61(1): 61–66.

Dwork, C., Kenthapadi, K., McSherry, F., Mironov, I., and Naor, M. (2006). Our data, ourselves: Privacy via distributed noise generation. In Annual International Conference on the Theory and Applications of Cryptographic Techniques, pages 486–503. Springer.

Dwork, C., Roth, A., et al. (2014). The algorithmic foundations of differential privacy. Foundations and Trends in Theoretical Computer Science, 9(3-4): 211–407.

Ramani, R. G. and Sivagami, G. (2011). Parkinson disease classification using data mining algorithms. International journal of computer applications, 32(9): 17–22.

Sakar, C. O. and Kursun, O. (2010). Telediagnosis of parkinson’s disease using measurements of dysphonia. Journal of medical systems, 34(4): 591–599.

Sakar, C. O., Serbes, G., Gunduz, A., Tunc, H. C., Nizam, H., Sakar, B. E., Tutuncu, M.,Aydin, T., Isenkul, M. E., and Apaydin, H. (2019). A comparative analysis of speech signal processing algorithms for parkinson’s disease classification and the use of the tunable q-factor wavelet transform. Applied Soft Computing, 74: 255–263.