Is P-value<0.05 Enough? Two Case Studies in Classifiers Evaluation

  • Nadine M. Neumann UFF
  • Alexandre Plastino UFF
  • Jony A. Pinto Junior UFF
  • Alex A. Freitas University of Kent

Resumo


Uma ferramenta comumente utilizada no processo de comparação de classificadores é a análise da significância estatística, realizada atravées de teste de hipóteses. Entretanto, percebe-se que muitos pesquisadores estão buscando cegamente a significância estatística por meio da condição p-valor<0,05 e ignorando conceitos importantes como o tamanho do efeito e o poder do teste. Neste trabalho, são evidenciados possíveis problemas causados pelo mau uso dessa ferramenta e como o tamanho do efeito e o poder do teste acrescentam informação para uma melhor tomada de decisão. Para tanto, são apresentados dois estudos de caso com os testes t de Student e de Wilcoxon para a comparação de dois classificadores.
Publicado
22/10/2018
Como Citar

Selecione um Formato
NEUMANN, Nadine M.; PLASTINO, Alexandre; PINTO JUNIOR, Jony A.; FREITAS, Alex A.. Is P-value<0.05 Enough? Two Case Studies in Classifiers Evaluation. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 15. , 2018, São Paulo. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018 . p. 94-103. ISSN 2763-9061. DOI: https://doi.org/10.5753/eniac.2018.4407.