Hvorfor kloge eksperter "undlader at afvise nullet" hver gang

Jeg så en gammel motorcykelfilm fra 1960’erne forleden aften, og jeg blev slået af motorcyklisternes slang. De havde deres helt eget sprog. Ligesom statistikere, hvis måde at tale på ofte forvirrer dem, der ikke er fortrolige med dataanalysens jargon.

Det fik mig til at tænke … hvad nu, hvis der fandtes en rockergruppe, der kun talte statistikere? Kald dem Nulls Angels. Forestil dig dem i deres farver, mens de kører gennem landskabet, analyserer data og spørger de mennesker, de møder på vejen, om de “forkaster nulhypotesen”.

Hvis du påpeger, hvor mærkeligt det udtryk lyder, vil Nulls Angels vide, at du ikke er cool … og ikke særlig bevidst om statistik.

Såfremt jeg udelukkende taler som redaktør, anerkender jeg, at “forkaster nulhypotesen” er skræmmende. “Failing to reject” virker som en overdrevent kompliceret ækvivalent til at acceptere. Det er i det mindste en klodset formulering.

Men det viser sig, at de rå og beredne statistikere i Nulls Angels har god grund til at tale på den måde. Ud fra et statistisk perspektiv er det unægteligt korrekt – og det ville bare være forkert at erstatte “failure to reject” med “accept”.

Hvad er nulhypotesen egentlig?

Hypotesetests omfatter t-tests med én og to stikprøver, test for association, test for normalitet og mange flere. (Alle disse test findes under menuen Stat i det statistiske program Minitab. Eller, hvis du ønsker lidt mere statistisk vejledning, kan assistenten føre dig gennem almindelige hypotesetests trin for trin.)

En hypotesetest undersøger to udsagn: nulhypotesen (eller forkortet H0) og alternativet (H1). Den alternative hypotese er det, vi håber at kunne understøtte. Vi antager, at nulhypotesen er sand, medmindre dataene giver tilstrækkeligt bevis for, at den ikke er det.

Du har hørt udtrykket “uskyldig indtil det modsatte er bevist”. Det betyder, at den anklagedes uskyld tages for givet, indtil skyldigheden er bevist. I statistik tages nulhypotesen for givet, indtil det er bevist, at den alternative hypotese er sand.

Så hvorfor “undlader vi at forkaste” nulhypotesen?

Det bringer spørgsmålet om “beviser” op.

Den grad af statistisk bevismateriale, som vi har brug for for at “bevise” den alternative hypotese, er konfidensniveauet. Tillidsniveauet er 1 minus vores risiko for at begå en type I-fejl, som opstår, når man fejlagtigt forkaster en nulhypotese, der er sand. Statistikere kalder denne risiko for alfa og kalder den også for signifikansniveauet. Den typiske alfa på 0,05 svarer til et konfidensniveau på 95 %: Vi accepterer en risiko på 5 % for at forkaste nulhypotesen, selv om den er sand. (I spørgsmål om liv eller død kan vi sænke risikoen for en type I-fejl til 1 % eller mindre.)

Uanset hvilket alfa-niveau vi vælger, har enhver hypotesetest kun to mulige udfald:

Forkast nulhypotesen og konkluder, at den alternative hypotese er sand på et konfidensniveau på 95 % (eller det niveau, du har valgt).
Du kan ikke forkaste nulhypotesen og konkludere, at der ikke er tilstrækkeligt med beviser til at antyde, at nulhypotesen er falsk på et konfidensniveau på 95 %.

Vi bruger ofte en p-værdi til at afgøre, om dataene understøtter nulhypotesen eller ej. Hvis testens p-værdi er mindre end vores valgte alfa-niveau, forkaster vi nulhypotesen. Eller som statistikere siger: “Når p-værdien er lav, må nulhypotesen bortfalde.”

Det forklarer stadig ikke, hvorfor en statistiker ikke “accepterer nulhypotesen”. Her er det afgørende: At man ikke kan forkaste nulhypotesen beviser ikke, at nulhypotesen er sand. Det skyldes, at en hypotesetest ikke afgør, hvilken hypotese der er sand eller endog hvilken der er mest sandsynlig: den vurderer kun, om der er beviser for at forkaste nulhypotesen.

“Null Until Proved Alternative”

Hør tilbage til “uskyldig indtil det modsatte er bevist”. Som dataanalytiker er det dig, der er dommeren. Hypotesetesten er retssagen, og nulhypotesen er den anklagede. Den alternative hypotese er anklagemyndigheden, som skal bevise sin sag uden for enhver rimelig tvivl (f.eks. med 95 % sikkerhed).

Hvis beviserne i retssagen ikke viser, at den anklagede er skyldig, er det heller ikke bevist, at den anklagede er uskyldig. På baggrund af de foreliggende beviser kan man dog ikke afvise denne mulighed. Hvordan ville du så bekendtgøre din dom?

“Ikke skyldig.”

Denne sætning er perfekt: “Ikke skyldig “siger ikke, at den anklagede er uskyldig, for det er ikke blevet bevist. Det siger bare, at anklagemyndigheden ikke kunne overbevise dommeren om at opgive antagelsen om uskyld.

Så “manglende afvisning af nulpunktet” er den statistiske pendant til “ikke skyldig”. I en retssag er det anklagemyndigheden, der har bevisbyrden. Ved analyse af data falder hele bevisbyrden på dine stikprøvedata. “Ikke skyldig” er ikke ensbetydende med “uskyldig”, og “ikke at forkaste” nulhypotesen er noget helt andet end at “acceptere” den.

Så hvis en gruppe plyndrende statistikere i deres Nulls Angels-læder nogensinde spørger, så bevar dig selv i deres gunst og vis, at du ved, at det at “undlade at forkaste nulhypotesen” ikke er at “acceptere nulhypotesen”

Hvorfor kloge eksperter “undlader at afvise nullet” hver gang

Hvad er nulhypotesen egentlig?

Så hvorfor “undlader vi at forkaste” nulhypotesen?

“Null Until Proved Alternative”

Skriv et svar Annuller svar