Is P-value<0.05 Enough? Two Case Studies in Classifiers Evaluation
Resumo
Uma ferramenta comumente utilizada no processo de comparação de classificadores é a análise da significância estatística, realizada atravées de teste de hipóteses. Entretanto, percebe-se que muitos pesquisadores estão buscando cegamente a significância estatística por meio da condição p-valor<0,05 e ignorando conceitos importantes como o tamanho do efeito e o poder do teste. Neste trabalho, são evidenciados possíveis problemas causados pelo mau uso dessa ferramenta e como o tamanho do efeito e o poder do teste acrescentam informação para uma melhor tomada de decisão. Para tanto, são apresentados dois estudos de caso com os testes t de Student e de Wilcoxon para a comparação de dois classificadores.
Publicado
22/10/2018
Como Citar
NEUMANN, Nadine M.; PLASTINO, Alexandre; PINTO JUNIOR, Jony A.; FREITAS, Alex A..
Is P-value<0.05 Enough?
Two Case Studies in Classifiers Evaluation. In: ENCONTRO NACIONAL DE INTELIGÊNCIA ARTIFICIAL E COMPUTACIONAL (ENIAC), 15. , 2018, São Paulo.
Anais [...].
Porto Alegre: Sociedade Brasileira de Computação,
2018
.
p. 94-103.
ISSN 2763-9061.
DOI: https://doi.org/10.5753/eniac.2018.4407.