Typ I och typ II-fel
Du kommer ihåg att typ II-fel är sannolikheten för att acceptera nollhypotesen (eller med andra ord ”misslyckas med att förkasta nollhypotesen”) när vi egentligen borde ha förkastat den. Denna sannolikhet betecknas med bokstaven β. Att förkasta nollhypotesen när vi egentligen inte borde ha gjort det är däremot typ I-fel och betecknas med α. I den här videon ser du bildmässigt var dessa värden finns på en ritning av de två fördelningarna av att H0 är sann och HAlt är sann.
- Typ I-fel (α): Vi förkastar felaktigt H0 trots att nollhypotesen är sann.
- Typ II-fel (β): Vi accepterar felaktigt (eller ”förkastar inte”) H0 trots att den alternativa hypotesen är sann.
En felmemo
Alternativ hypotes (Ha): Det finns en varg
Nollhypotes (H0): Det finns ingen varg
- Typ I-fel (α): Vi förkastar felaktigt nollhypotesen, att det inte finns någon varg (dvs, vi tror att det finns en varg), trots att nollhypotesen är sann (det finns ingen varg).
- Typ II-fel (β): vi accepterar felaktigt (eller ”förkastar inte”) nollhypotesen (det finns ingen varg), trots att den alternativa hypotesen är sann (det finns en varg).
Statistisk styrka
Ett tests styrka är sannolikheten att testet förkastar nollhypotesen när den alternativa hypotesen är sann. Med andra ord är det sannolikheten för att inte göra ett typ II-fel. Med andra ord, vilken effekt har vårt test för att fastställa en skillnad mellan två populationer (H0 och HA) om en sådan skillnad finns?
- Effekt (1-β): sannolikheten för att korrekt förkasta nollhypotesen (när nollhypotesen inte är sann).
- Typ II-fel (β): sannolikheten att inte lyckas förkasta nollhypotesen (när nollhypotesen inte är sann).
Det finns fyra inbördes relaterade komponenter i power:
- B: beta (β), eftersom power är 1-β
- E: effektstorlek, skillnaden mellan medelvärdena för provtagningsfördelningarna för H0 och HAlt. Ju större skillnaden mellan dessa två medelvärden är, desto större effekt har ditt test för att upptäcka en skillnad. Detta skrivs matematiskt som en normaliserad skillnad (d) mellan medelvärdena för de två populationerna. d = (μ1-μ0)/σ.
- A: alfa (α), signifikansvärdet som vanligtvis sätts till 0,05, detta är den gräns vid vilken vi accepterar eller förkastar vår nollhypotes. Om vi gör α mindre (α = 0,1) blir det svårare att förkasta H0. Detta gör att effekten blir mindre.
- N: urvalsstorlek (n). Ju större du gör populationen, desto mindre blir standardfelet (SE = σ/√n). I grund och botten gör det stickprovsfördelningen smalare och gör därför β mindre.
Det hjälper verkligen att se dessa grafiskt i videon. Försök att rita upp exempel på varje hur ändring av varje komponent förändrar effekten tills du förstår det och ställ gärna frågor (i kommentarerna eller via e-post).
Klinisk kontra statistisk signifikans
Klinisk signifikans skiljer sig från statistisk signifikans. En skillnad mellan medelvärden, eller en behandlingseffekt, kan vara statistiskt signifikant men inte kliniskt betydelsefull. Om urvalet är tillräckligt stort kan till exempel mycket små skillnader vara statistiskt signifikanta (t.ex. en viktförändring på ett pund, en blodtrycksförändring på 1 mmHg) även om de inte kommer att ha någon verklig inverkan på patientens resultat. Det är alltså viktigt att uppmärksamma såväl den kliniska betydelsen som den statistiska betydelsen när man bedömer studiens resultat. Den kliniska betydelsen bestäms med hjälp av klinisk bedömning samt resultat av andra studier som visar den kliniska effekten i efterföljande led av kortare studieresultat.
Testa din förståelse
Med det här problemet inställt på effekt.