Porque é que os peritos sagazes “Falham em Rejeitar o Nulo” Todas as vezes

Assisti a um filme de motocicleta velha dos anos 60 na outra noite, e fiquei impressionado com a gíria dos motoqueiros. Eles tinham uma linguagem só deles. Tal como os estatísticos, cuja maneira de falar confunde frequentemente aqueles que não são hep para a gíria da análise de dados.

Pôs-me a pensar…e se existisse uma gangue de motociclistas só de estatística? Chama-lhes os Nulls Angels. Imagine-os em suas cores, rasgando pelo campo, analisando dados e perguntando às pessoas que encontram na estrada se eles “não conseguem rejeitar a hipótese nula”.

Se você apontar como essa frase soa estranha, os Nulls Angels saberão que você não é legal…e não tem muito conhecimento de estatísticas.

Falando puramente como um editor, reconheço que “não conseguir rejeitar a hipótese nula” é digno de encolhimento. “Falhar em rejeitar” parece ser um equivalente demasiado complicado de aceitar. No mínimo, é um fraseado desajeitado.

Mas acontece que aqueles estatísticos grosseiros e prontos nos Anjos Nulos têm boas razões para falar assim. De uma perspectiva estatística, é inegavelmente preciso – e substituir “falha em rejeitar” por “aceitar” seria simplesmente errado.

Qual é a Hipótese Nula, Enfim?

Testes de Hipótese incluem testes de uma e duas amostras, testes de associação, testes de normalidade, e muitos mais. (Todos esses testes estão disponíveis no menu Stat do software estatístico do Minitab. Ou, se você quiser um pouco mais de orientação estatística, o assistente pode guiá-lo através de testes de hipóteses comuns passo a passo.)

Um teste de hipóteses examina duas proposições: a hipótese nula (ou H0 para abreviar), e a alternativa (H1). A hipótese alternativa é o que nós esperamos apoiar. Presumimos que a hipótese nula é verdadeira, a menos que os dados forneçam evidência suficiente de que não é.

Você ouviu a frase “Inocente até prova em contrário”. Isso significa que a inocência do réu é tida como certa até que a culpabilidade seja provada. Em estatística, a hipótese nula é tida como certa até que a alternativa seja provada como verdadeira.

Então por que nós “Falhamos em Rejeitar” a Hipótese Nula?

Isso traz à tona a questão da “prova”.

O grau de evidência estatística de que precisamos para “provar” a hipótese alternativa é o nível de confiança. O nível de confiança é 1 menos o nosso risco de cometer um erro de Tipo I, que ocorre quando rejeitamos incorrectamente uma hipótese nula que é verdadeira. Os estatísticos chamam isso de risco alfa, e também se referem a ele como o nível de significância. O alfa típico de 0,05 corresponde a um nível de confiança de 95%: estamos aceitando uma chance de 5% de rejeitar o nulo mesmo que seja verdade. (Em questões de vida ou morte, podemos reduzir o risco de um erro do Tipo I para 1% ou menos.)

Independentemente do nível alfa que escolhemos, qualquer teste de hipótese tem apenas dois resultados possíveis:

  1. Rejeite a hipótese nula e conclua que a hipótese alternativa é verdadeira no nível de confiança de 95% (ou qualquer nível que você tenha selecionado).
  2. Não rejeitar a hipótese nula e concluir que não há evidência suficiente para sugerir que a hipótese nula é falsa no nível de confiança de 95%.

Usamos frequentemente um valor p para decidir se os dados suportam ou não a hipótese nula. Se o valor de p do teste for inferior ao nosso nível alfa selecionado, nós rejeitamos o nulo. Ou, como dizem os estatísticos “Quando o valor de p é baixo, o nulo deve ir”

Isso ainda não explica porque um estatístico não “aceita a hipótese nula”. Eis a conclusão: não rejeitar a hipótese nula não prova que a hipótese nula é verdadeira. Isso porque um teste de hipótese não determina qual hipótese é verdadeira, ou mesmo qual é mais provável: ele apenas avalia se existem evidências para rejeitar a hipótese nula.

“Alternativa Nula Até Prova”

Cobrir de volta a “inocente até prova em contrário”. Como analista de dados, você é o juiz. O teste de hipótese é o julgamento, e a hipótese nula é o réu. A hipótese alternativa é a acusação, que precisa fazer seu caso além de uma dúvida razoável (digamos, com 95% de certeza).

Se a evidência do julgamento não mostrar que o réu é culpado, também não provou que o réu é inocente. No entanto, com base nas provas disponíveis, você não pode rejeitar essa possibilidade. Então como você anunciaria seu veredicto?

“Inocente”

Essa frase é perfeita: “Inocente “não diz que o réu é inocente, porque isso não foi provado. Só diz que a acusação não conseguiu convencer o juiz a abandonar a presunção de inocência.

Então “não rejeitar o nulo” é o equivalente estatístico de “inocente”. Num julgamento, o ónus da prova recai sobre a acusação. Ao analisar os dados, todo o ónus da prova recai sobre os seus dados de amostra. “Inocente” não significa “inocente”, e “não rejeitar” a hipótese nula é bem diferente de “aceitá-la”.

Então, se um grupo de marauding statisticians marauding em seus Nulls Angels leathers sempre pede, mantenha-se em suas boas graças, e mostre que você sabe que “falhar em rejeitar o nulo” não é “aceitar o nulo”

Deixe uma resposta

O seu endereço de email não será publicado.