Type I og type II-fejl
Du husker nok, at type II-fejl er sandsynligheden for at acceptere nulhypotesen (eller med andre ord “ikke at forkaste nulhypotesen”), når vi faktisk burde have forkastet den. Denne sandsynlighed er betegnet med bogstavet β. I modsætning hertil er det at forkaste nulhypotesen, når vi egentlig ikke burde have gjort det, type I-fejl og betegnet med α. I denne video kan du se billedligt, hvor disse værdier ligger på en tegning af de to fordelinger af, at H0 er sandt og HAlt er sandt.
- Type I-fejl (α): Vi forkaster H0 fejlagtigt, selv om nulhypotesen er sand.
- Type II-fejl (β): Vi accepterer fejlagtigt (eller “forkaster ikke”) H0, selv om den alternative hypotese er sand.
En fejlmnemoteknik
Alternativhypotese (Ha): Der er en ulv
Nulhypotese (H0): Der er ingen ulv
- Type I-fejl (α): Vi forkaster fejlagtigt nulhypotesen, at der ikke er en ulv (dvs, vi tror, at der er en ulv), selv om nulhypotesen er sand (der er ingen ulv).
- Type II-fejl (β): Vi accepterer fejlagtigt (eller “forkaster ikke”) nulhypotesen (der er ingen ulv), selv om den alternative hypotese er sand (der er en ulv).
Statistisk effekt
Effekt af en test er sandsynligheden for, at testen vil forkaste nulhypotesen, når den alternative hypotese er sand. Med andre ord er det sandsynligheden for ikke at lave en type II-fejl. Med andre ord, hvad er kraften af vores test til at bestemme en forskel mellem to populationer (H0 og HA), hvis en sådan forskel findes?
- Kraft (1-β): sandsynligheden for korrekt at forkaste nulhypotesen (når nulhypotesen ikke er sand).
- Type II-fejl (β): sandsynligheden for ikke at forkaste nulhypotesen korrekt (når nulhypotesen ikke er sand).
Der er fire indbyrdes forbundne komponenter i power:
- B: beta (β), da power er 1-β
- E: effektstørrelse, forskellen mellem middelværdierne af prøveudtagningsfordelingerne for H0 og HAlt. Jo større forskellen mellem disse to middelværdier er, jo mere styrke vil din test have til at påvise en forskel. Dette skrives matematisk som en normaliseret forskel (d) mellem de to populationers gennemsnit. d = (μ1-μ0)/σ.
- A: alpha (α), signifikansværdien, som typisk sættes til 0,05. Dette er den grænse, ved hvilken vi accepterer eller forkaster vores nulhypotese. Hvis vi gør α mindre (α = 0,1), bliver det sværere at forkaste H0. Dette gør effekten mindre.
- N: stikprøvestørrelse (n). Jo større man gør populationen, jo mindre bliver standardfejlen (SE = σ/√n). Dybest set gør det stikprøvefordelingen mere smal og gør derfor β mindre.
Det hjælper virkelig at se disse grafisk i videoen. Prøv at tegne eksempler på hver, hvordan ændring af hver komponent ændrer effekten, indtil du forstår det, og du er velkommen til at stille spørgsmål (i kommentarerne eller via e-mail).
Klinisk versus statistisk signifikans
Klinisk signifikans er forskelligt fra statistisk signifikans. En forskel mellem middelværdier eller en behandlingseffekt kan være statistisk signifikant, men ikke klinisk betydningsfuld. Hvis stikprøvestørrelsen er stor nok, kan meget små forskelle f.eks. være statistisk signifikante (f.eks. 1 pund ændring i vægt, 1 mmHg i blodtryk), selv om de ikke vil have nogen reel indvirkning på patientens resultater. Det er derfor vigtigt at være opmærksom på såvel klinisk signifikans som statistisk signifikans, når man vurderer undersøgelsesresultater. Klinisk signifikans bestemmes ved hjælp af klinisk vurdering samt resultater af andre undersøgelser, som viser den efterfølgende kliniske effekt af undersøgelsesresultater på kortere sigt.
Test din forståelse
Med denne opgave sat på effekt.