I. típusú és II. típusú hiba
A II. típusú hiba az a valószínűség, hogy elfogadjuk a nullhipotézist (vagy más szóval “nem utasítjuk el a nullhipotézist”), amikor valójában el kellett volna utasítanunk azt. Ezt a valószínűséget a β betű jelöli. Ezzel szemben a nullhipotézis elvetése, amikor valójában nem kellett volna, az I. típusú hiba, és ezt α jelöli. Ebben a videóban képszerűen láthatod, hol vannak ezek az értékek a H0 igaz és a HAlt igaz két eloszlásának rajzán.
- I. típusú hiba (α): tévesen utasítjuk el a H0-t, holott a nullhipotézis igaz.
- II. típusú hiba (β): tévesen fogadjuk el (vagy “nem utasítjuk el”) a H0-t annak ellenére, hogy az alternatív hipotézis igaz.
Egy hiba mnemotechnika
Alternatív hipotézis (Ha): van farkas
Nullhipotézis (H0): nincs farkas
- I. típusú hiba (α): tévesen utasítjuk el a nullhipotézist, hogy nincs farkas (ill, azt hisszük, hogy van farkas), holott a nullhipotézis igaz (nincs farkas).
- II. típusú hiba (β): tévesen elfogadjuk (vagy “nem utasítjuk el”) a nullhipotézist (nincs farkas), holott az alternatív hipotézis igaz (van farkas).
Statisztikai teljesítmény
A teszt teljesítménye annak a valószínűsége, hogy a teszt elutasítja a nullhipotézist, ha az alternatív hipotézis igaz. Más szóval annak a valószínűsége, hogy nem követünk el II. típusú hibát. Más szóval, mekkora a tesztünk ereje, hogy két populáció (H0 és HA) között különbséget állapítson meg, ha létezik ilyen különbség?
- Erő (1-β): a nullhipotézis helyes elutasításának valószínűsége (amikor a nullhipotézis nem igaz).
- II. típusú hiba (β): a nullhipotézis nem megfelelő elutasításának valószínűsége (amikor a nullhipotézis nem igaz).
A teljesítménynek négy egymással összefüggő összetevője van:
- B: béta (β), mivel a teljesítmény 1-β
- E: hatásméret, a H0 és HAlt mintavételi eloszlásainak átlagai közötti különbség. Minél nagyobb a különbség e két átlag között, annál nagyobb a teszted ereje a különbség kimutatására. Ezt matematikailag a két populáció átlaga közötti normalizált különbségként (d) írjuk fel. d = (μ1-μ0)/σ.
- A: alfa (α), a szignifikanciaérték, amelyet általában 0,05-ben határozunk meg, ez az a határérték, amelynél elfogadjuk vagy elutasítjuk a nullhipotézisünket. Ha α-t kisebbre vesszük (α = 0,1), akkor a H0-t nehezebb elutasítani. Ezáltal kisebb lesz a teljesítmény.
- N: a minta mérete (n). Minél nagyobbá tesszük a sokaságot, annál kisebb lesz a standard hiba (SE = σ/√n). Alapvetően szűkebbé teszi a minta eloszlását, és így a β kisebb lesz.
A videóban tényleg segít, ha ezeket grafikusan látjuk. Próbáljatok ki példákat rajzolni arra, hogy az egyes összetevők megváltoztatása hogyan változtatja meg a teljesítményt, amíg meg nem értitek, és nyugodtan tegyetek fel kérdéseket (a hozzászólásokban vagy e-mailben).
Klinikai versus statisztikai szignifikancia
A klinikai szignifikancia különbözik a statisztikai szignifikanciától. Az átlagok közötti különbség vagy a kezelés hatása lehet statisztikailag szignifikáns, de klinikailag nem jelentős. Például, ha a minta mérete elég nagy, nagyon kis különbségek is lehetnek statisztikailag szignifikánsak (pl. egy font súlyváltozás, 1 mmHg vérnyomásváltozás), még akkor is, ha ezeknek nincs valódi hatásuk a beteg kimenetelére. Fontos tehát, hogy a vizsgálati eredmények értékelésekor a statisztikai szignifikancia mellett a klinikai szignifikanciára is figyelni kell. A klinikai szignifikancia meghatározása a klinikai megítélés, valamint más tanulmányok eredményei alapján történik, amelyek a rövidebb távú vizsgálati eredmények utólagos klinikai hatását mutatják.
Tesztelje a megértését
Ezzel a feladattal a teljesítményre állítva.