Varför smarta experter ”misslyckas med att förkasta nollan” varje gång

Jag tittade på en gammal motorcykelfilm från 1960-talet häromkvällen, och jag slogs av motorcyklisternas slang. De hade ett helt eget språk. Precis som statistiker, vars sätt att tala ofta förvirrar dem som inte är insatta i dataanalysens jargong.

Det fick mig att tänka… tänk om det fanns ett gäng med enbart statistiker? Kalla dem Nulls Angels. Tänk dig att de i sina färger drar fram över landsbygden, analyserar data och frågar de människor de möter på vägen om huruvida de ”misslyckas med att förkasta nollhypotesen”.

Om du påpekar hur konstigt den frasen låter kommer Nulls Angels att veta att du inte är cool… och inte särskilt insatt i statistik.

Som redaktör medger jag att ”misslyckas med att förkasta nollhypotesen” är krumbuktande. ”Att misslyckas med att förkasta” verkar vara en alltför komplicerad motsvarighet till att acceptera. Det är åtminstone en klumpig formulering.

Men det visar sig att de råa och färdiga statistikerna i Nulls Angels har goda skäl att tala så. Ur ett statistiskt perspektiv är det onekligen korrekt – och att ersätta ”misslyckande att förkasta” med ”acceptera” skulle helt enkelt vara fel.

Vad är nollhypotesen egentligen?

Hypotesprövningar omfattar t-test med ett och två stickprov, test för association, test för normalitet och många fler. (Alla dessa tester finns tillgängliga under menyn Stat i statistikprogrammet Minitab. Om du vill ha lite mer statistisk vägledning kan assistenten leda dig steg för steg genom vanliga hypotesprövningar.)

En hypotesprövning undersöker två påståenden: nollhypotesen (förkortat H0) och alternativet (H1). Den alternativa hypotesen är det som vi hoppas kunna stödja. Vi antar att nollhypotesen är sann, om inte uppgifterna ger tillräckliga bevis för att den inte är det.

Du har hört uttrycket ”oskyldig tills motsatsen bevisats”. Det betyder att den anklagades oskuld tas för given tills skulden är bevisad. I statistiken tas nollhypotesen för given tills alternativet bevisas vara sant.

Så varför ”misslyckas vi med att förkasta” nollhypotesen?

Detta tar upp frågan om ”bevis”.

Den grad av statistiska bevis som vi behöver för att ”bevisa” alternativhypotesen är konfidensnivån. Konfidensnivån är 1 minus vår risk att begå ett typ I-fel, vilket inträffar när man felaktigt förkastar en nollhypotes som är sann. Statistiker kallar denna risk för alfa, och hänvisar också till den som signifikansnivå. Det typiska alfavärdet 0,05 motsvarar en konfidensnivå på 95 %: vi accepterar en risk på 5 % att förkasta nollhypotesen även om den är sann. (När det gäller frågor som rör liv eller död kan vi sänka risken för ett typ I-fel till 1 % eller mindre.)

Oavsett vilken alfa-nivå vi väljer har varje hypotesprövning endast två möjliga utfall:

  1. Förkasta nollhypotesen och dra slutsatsen att den alternativa hypotesen är sann på 95 % konfidensnivå (eller vilken nivå du än har valt).
  2. Förkasta inte nollhypotesen och dra slutsatsen att det inte finns tillräckligt med bevis för att nollhypotesen är falsk på 95 procents konfidensnivå.

Vi använder ofta ett p-värde för att avgöra om uppgifterna stöder nollhypotesen eller inte. Om testets p-värde är mindre än vår valda alfa-nivå förkastar vi nollhypotesen. Eller som statistiker säger: ”När p-värdet är lågt måste nollhypotesen bort.”

Detta förklarar fortfarande inte varför en statistiker inte ”accepterar nollhypotesen”. Här är det viktigaste: Att inte förkasta nollhypotesen bevisar inte att nollhypotesen är sann. Det beror på att ett hypotest inte avgör vilken hypotes som är sann, eller ens vilken som är mest sannolik: det bedömer bara om det finns bevis för att förkasta nollhypotesen.

”Noll till dess att alternativet är bevisat”

Hark back to ”oskyldig till dess att det är bevisat att du är skyldig”. Som dataanalytiker är du domaren. Hypotesprövningen är rättegången och nollhypotesen är den tilltalade. Den alternativa hypotesen är åklagaren, som måste bevisa sin sak bortom rimligt tvivel (säg med 95 procents säkerhet).

Om bevisningen i rättegången inte visar att den tilltalade är skyldig, har den inte heller bevisat att den tilltalade är oskyldig. Utifrån de tillgängliga bevisen kan man dock inte förkasta den möjligheten. Hur skulle du då meddela din dom?

”Inte skyldig.”

Den frasen är perfekt: ”Inte skyldig ”säger inte att den tilltalade är oskyldig, eftersom det inte har bevisats. Det säger bara att åklagaren inte kunde övertyga domaren att överge antagandet om oskuld.

Så ”misslyckande att förkasta nollresultatet” är den statistiska motsvarigheten till ”inte skyldig”. I en rättegång faller bevisbördan på åklagaren. När du analyserar data faller hela bevisbördan på dina provdata. ”Icke skyldig” betyder inte ”oskyldig”, och ”att inte förkasta” nollhypotesen är något helt annat än att ”acceptera” den.

Så om en grupp marodörerande statistiker i sina Nulls Angels-läder någonsin frågar, håll dig i deras gunst och visa att du vet att ”att inte förkasta nollhypotesen” inte är att ”acceptera nollhypotesen”

.

Lämna ett svar

Din e-postadress kommer inte publiceras.