Avaliação da Redução de Dimensionalidade e da Discretização Aplicados na Recuperação de Conteúdo de Dados Médicos
Resumo
A recuperação de conteúdo em bases de dados de séries temporais é uma das tarefas em mineração de dados que pode auxiliar especialistas no processo de tomada de decisão. No entanto, a aplicação dessa tarefa em grandes conjuntos de dados pode apresentar alto custo computacional. Métodos de pré-processamento podem ser aplicados com o intuito de auxiliar nesse problema. Neste trabalho é avaliada a influência dos métodos de redução de dimensionalidade e de discretização na recuperação de conteúdo. Nessa avaliação foram utilizados dados de exames de manometria ano-retal e de eletrocardiograma. Em ambos os conjuntos de dados, os métodos de pré-processamento influenciaram positivamente no desempenho da recuperação de conteúdo.
Referências
Davis, J. & Goadrich, M. (2006). The relationship between precision-recall and roc curves. In Proceedings of the 23rd International Conference on Machine Learning, pág. 233–240, New York, USA. ACM.
Ferrero, C. A., Lee, H. D., Monard, M. C., Wu, F. C., Coy, C. S. R., Fagundes, J. J., & Góes, J. R. N. (2007). Aplicação de métodos de séries temporais para a identificação de seções em exames de manometria anorretal. In II Congresso da Academia Trinacional de Ciências, pág. 1–10, Foz do Iguaçu, Brasil.
Goldberger, A. L., Amaral, L. A. N., Glass, L., Hausdorff, J. M., Ivanov, P. C., Mark, R. G., Mietus, J. E., Moody, G. B., Peng, C., & Stanley, H. E. (2000). Physiobank, physiotoolkit, and physionet: Components of a new research resource for complex physiologic signals. Circulation.
Han, J. & Kamber, M. (2006). Data Mining: Concepts and Techniques. Elsevier, San Francisco, EUA, 2 edição.
Lee, H. D. (2005). Seleção de atributos importantes para a extração de conhecimento de bases de dados. PhD thesis, Universidade de São Paulo.
Lin, J., Keogh, E., Lonardi, S., & Chiu, B. (2003). A symbolic representation of time series, with implications for streaming algorithms. In Proceedings of the 8th Workshop on Research Issues in Data Mining and Knowledge Discovery, pág. 2–11, New York, USA. ACM.
Mörchen, F. (2006). Time series knowledger mining. Master’s thesis, Philipps-Universität Marburg, Marburg, Germany.
Olszewski, R. T. (2001). Generalized Featue Extraction for Structural Pattern Recognition in Time-Series Data. PhD thesis, School of Computer Science Carnegie Mellon University.
Rezende, S. O. (2003). Sistemas inteligentes: fundamentos e aplicações. Manole.
Saad, L. H. C. (2002). Quantificação da função esfincteriana pela medida da capacidade de sustentação da pressão de contração voluntária do canal anal. PhD thesis, Universidade Estadual de Campinas.
Spolaôr, N., Lee, H. D., Ferrero, C. A., Coy, C. S. R., Fagundes, J. J., & Wu, F. C. (2008). Um estudo da aplicação de clustering de séries temporais em dados médicos. In Anais do III Congresso da Academia Trinacional de Ciências, pág. 1–10, Foz do Iguaçu, Brasil.
