Análise comparativa de modelos de Machine Learning para predição de diabetes por meio dos modelos SVM e K-means
Resumo
Este trabalho compara técnicas de aprendizado de máquina para predição de diabetes utilizando o Pima Indians Diabetes Database. Foram avaliados quatro modelos supervisionados (regressão logística, MLP, SVM com e sem PCA) e uma abordagem não supervisionada (K-means). A avaliação envolve métricas de performance (acurácia, F1-score, sensibilidade, especificidade e AUC-ROC) e análise da robustez dos modelos frente à redução de dimensionalidade via PCA. Os resultados mostram que o SVM com PCA obteve a melhor discriminação (AUC = 0,84), enquanto o K-means ajudou a revelar padrões clínicos relevantes sem uso de rótulos.Referências
Antunes, Y. R., de Oliveira, E. M., Pereira, L. A., & Picanço, M. F. P. (2021). Diabetes Mellitus Tipo 2: A importância do diagnóstico precoce. Brazilian Journal of Development, 7(12), 116526-116551.
Aithal, P. S. (2023). Visualization and Explorative Data Analysis. IJERSTE, 12(3), 11-21. Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
Ferreira, A. A. (2014). Fundamentos de Aprendizado de Máquina. LTC.
Fleck, L. et al. (2016). Redes neurais artificiais: Princípios básicos. Revista Eletrônica Científica Inovação e Tecnologia, 1(13), 47–57.
Furtado, M. I. V. (2019). Redes Neurais Artificiais: uma abordagem para sala de aula. Atena Editora.
Miranda, C. E. B. (2023). Aplicação da regressão logística binária para manutenção preditiva em máquinas de ressonância magnética. UTFPR.
Pedregosa, F. et al. (2011). Scikit-learn: Machine Learning in Python. JMLR, 12, 2825–2830.
Rauber, T. W. (2005). Redes Neurais Artificiais. Universidade Federal do Espírito Santo.
Witten, I. H., Frank, E., & Hall, M. A. (2016). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.
Tiago, C. M., & Leitão, V. M. (2002). Utilização de funções de base radial em problemas unidimensionais de análise estrutural. Métodos Numéricos en Ingenierıa V, CD. SEMNI.
Witten, I. H., Frank, E., & Hall, M. A. (2016). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.
Aithal, P. S. (2023). Visualization and Explorative Data Analysis. IJERSTE, 12(3), 11-21. Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.
Ferreira, A. A. (2014). Fundamentos de Aprendizado de Máquina. LTC.
Fleck, L. et al. (2016). Redes neurais artificiais: Princípios básicos. Revista Eletrônica Científica Inovação e Tecnologia, 1(13), 47–57.
Furtado, M. I. V. (2019). Redes Neurais Artificiais: uma abordagem para sala de aula. Atena Editora.
Miranda, C. E. B. (2023). Aplicação da regressão logística binária para manutenção preditiva em máquinas de ressonância magnética. UTFPR.
Pedregosa, F. et al. (2011). Scikit-learn: Machine Learning in Python. JMLR, 12, 2825–2830.
Rauber, T. W. (2005). Redes Neurais Artificiais. Universidade Federal do Espírito Santo.
Witten, I. H., Frank, E., & Hall, M. A. (2016). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.
Tiago, C. M., & Leitão, V. M. (2002). Utilização de funções de base radial em problemas unidimensionais de análise estrutural. Métodos Numéricos en Ingenierıa V, CD. SEMNI.
Witten, I. H., Frank, E., & Hall, M. A. (2016). Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann.
Publicado
12/11/2025
Como Citar
FREIRE, Ester Miriã de Sousa; LIMA, Paulo Anderson Gonçalves de; FEITOSA, Ângelo Carlos Avelino; SOUSA, Lucas Fontineli Alves; AQUINO, Simone Azevedo Bandeira de Melo; COSTA, Daniel Duarte.
Análise comparativa de modelos de Machine Learning para predição de diabetes por meio dos modelos SVM e K-means. In: ESCOLA REGIONAL DE APRENDIZADO DE MÁQUINA E INTELIGÊNCIA ARTIFICIAL DA REGIÃO SUL (ERAMIA-RS), 1. , 2025, Porto Alegre/RS.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2025
.
p. 344-347.
DOI: https://doi.org/10.5753/eramiars.2025.16705.