Utilização do algoritmo pam em k-medóides para agrupamento de dados textuais de saúde mental

  • Bruno G. Silva UFMT
  • Anderson C. S. Oliveira UFMT
  • Lia H. M. Morita UFMT
  • Thiago M. Brito UFMT

Resumo


O objetivo deste estudo foi investigar a aplicação do algoritmo PAM para o agrupamento utilizando o método k-medóide, aplicado em perguntas abertas de um questionário sobre saúde mental de estudantes universitários. O algoritmo PAM foi empregado com a distância euclidiana, tendo como base a matriz de documentos e termos. Os resultados demonstraram que o algoritmo PAM, com dois, três e quatro k-medóides iniciais, analisou 427 respostas abertas, com um volume de 2101 palavras, com tempo de processamento de 40.05,40.39 e 48.69 segundos respectivamente. O algoritmo PAM demonstrou uma boa eficiência para realizar análises de clusters em dados textuais.

Palavras-chave: Mineração de texto, Matriz de documentos e termos, Percepção de saúde mental, Dados não estruturados, Questionários

Referências

Ariff, N. M., Bakar, M. A. A., and Rahmad, M. I. (2018). Comparative study of document clustering algorithms. International Journal of Engineering Technology, 7(4.11):246–251.

Brito, J. A. M., Ochi, L. S., Brito, L. R., and Montenegro, F. M. T. (2010). Um algoritmo para o agrupamento baseado em k-medoids. Revista Brasileira de Estatistica, 71(234):75–100.

Feinerer, I. and Hornik, K. (2023). tm: Text Mining Package. R package version 0.7-11.

García, R. G., Beltrán, B., Vilariño, D., Zepeda, C., and Martínez, R. (2020). Comparison of clustering algorithms in text clustering tasks. Computación y Sistemas, 24(2):499–437.

Maechler, M., Rousseeuw, P., Struyf, A., Hubert, M., and Hornik, K. (2023). cluster: Cluster Analysis Basics and Extensions.

R Core Team (2023). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria.

Vishwakarma, S., Nair, D. P. S., and Rao, D. S. (2017). Comparative study of k-means andk-medoid clustering for social media text mining. NTERNATIONAL JOURNAL OF ADVANCE SCIENTIFIC RESEARCH AND ENGINEERING TRENDS, 2(1):297–302.
Publicado
28/11/2023
SILVA, Bruno G.; OLIVEIRA, Anderson C. S.; MORITA, Lia H. M.; BRITO, Thiago M.. Utilização do algoritmo pam em k-medóides para agrupamento de dados textuais de saúde mental. In: ESCOLA REGIONAL DE INFORMÁTICA DE MATO GROSSO (ERI-MT), 12. , 2023, Cuiabá/MT. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2023 . p. 201-205. ISSN 2447-5386. DOI: https://doi.org/10.5753/eri-mt.2023.236246.