NÍVEIS DE SIGNIFICÂNCIA E TAXAS DE ERRO PARA A ANÁLISE DE NORMALIDADE POR ANDERSON-DARLING

Thamara Júlia Ferreira Almeida; Acálita Godinho de Oliveira; Isadora Azevedo Perpétuo; Fernanda Aparecida Nazário de Carvalho; Ivelton Alves Pimenta; Bruno Oliveira Lafetá

Sistema Online de Conferências - IFMG Campus Bambuí, XIII Jornada Científica

Thamara Júlia Ferreira Almeida, Acálita Godinho de Oliveira, Isadora Azevedo Perpétuo, Fernanda Aparecida Nazário de Carvalho, Ivelton Alves Pimenta, Bruno Oliveira Lafetá

Última alteração: 2021-10-13

Resumo

A inspeção estatística da normalidade de dados amostrais é uma etapa importante para a aplicação de procedimentos paramétricos, convencionalmente adotados na pesquisa científica. Embora o teste de Anderson-Darling seja uma alternativa para a análise formal de normalidade, ainda, persistem dúvidas sobre suas características em ocasiões com diferentes níveis de significância. A escolha do nível de significância deve ser vista com bastante cautela, para evitar problemas de interpretações e decisões equivocadas. Diante do exposto, o objetivo do presente trabalho foi avaliar taxas de erro do teste de Anderson-Darling para diferentes níveis de significância. O banco de dados foi constituído por um total de 1.200 simulações, 600 simulações provenientes da geração de números aleatórios normalmente distribuídos e o restante, com distribuição log-normal. O tamanho da amostra correspondente a cada simulação foi de 30 unidades. Avaliaram-se as taxas dos erros tipo I (rejeição da hipótese de normalidade quando na realidade é verdadeira) e tipo II (deixar de rejeitar a hipótese de normalidade quando na realidade é falsa) do teste de Anderson-Darling. As simulações sob a hipótese nula de normalidade foram utilizadas para a quantificação do erro tipo I e aquelas sob a hipótese nula de log normalidade, para a estimativa do erro tipo II. Para diagnóstico de efeito estatístico, avaliaram-se dez níveis de significância, assim discriminados: α1 = 1%, α2 = 2%, ... e α10 = 10%. Optou-se por essa amplitude de valores em virtude do frequente uso nas experimentações agrícola e florestal. Todas as análises estatísticas foram efetuadas com auxílio do software R (versão 4.1.0). As taxas do erro tipo I foram de 2,5% (Erro tipo II de 5,0%), 4,0% (Erro tipo II de 3,5%), 4,5% (Erro tipo II de 3,5%), 5,5% (Erro tipo II de 3,5%), 7,0% (Erro tipo II de 2,5%), 8,0% (Erro tipo II de 2,0%), 9,0% (Erro tipo II de 1,5%), 10,0% (Erro tipo II de 1,5%), 10,5% (Erro tipo II de 1,5%) e 11,5% (Erro tipo II de 1,5%) para os níveis de significância de 1 a 10%, respectivamente. Conclui-se que para o tamanho de amostra estudado, o teste de Anderson-Darling não controlou adequadamente o erro tipo I, com taxas de erro superiores aos níveis de significância. Maiores tamanhos de amostra são recomendados para a aplicação deste teste de normalidade. Por outro lado, o erro tipo II foi controlado assumindo níveis de significância a partir de 4% de probabilidade.