Chybou typu I a chybou typu II
Pamatujete si, že chyba typu II je pravděpodobnost přijetí nulové hypotézy (nebo jinými slovy „nezamítnutí nulové hypotézy“), i když jsme ji ve skutečnosti měli zamítnout. Tato pravděpodobnost se značí písmenem β. Naproti tomu zamítnutí nulové hypotézy, když jsme ji ve skutečnosti zamítnout neměli, je chyba typu I a značí se písmenem α. V tomto videu názorně uvidíte, kde jsou tyto hodnoty na nákresu dvou rozdělení H0 jako pravdivé a HAlt jako pravdivé.
- Chyba typu I (α): nesprávně zamítneme H0, i když je nulová hypotéza pravdivá.
- Chyba II. typu (β): nesprávně přijmeme (nebo „nezamítneme“) H0, přestože alternativní hypotéza je pravdivá.
Chybná mnemotechnika
Alternativní hypotéza (Ha): existuje vlk
Nulová hypotéza (H0): vlk neexistuje
- Chyba I. typu (α): nesprávně zamítneme nulovou hypotézu, že vlk neexistuje (tj, věříme, že vlk existuje), přestože nulová hypotéza je pravdivá (vlk neexistuje).
- Chyba II. typu (β): nesprávně přijmeme (nebo „nezamítneme“) nulovou hypotézu (vlk neexistuje), přestože alternativní hypotéza je pravdivá (vlk existuje).
Statistická síla
Síla testu je pravděpodobnost, že test zamítne nulovou hypotézu, když je alternativní hypotéza pravdivá. Jinými slovy, pravděpodobnost, že se nedopustíme chyby typu II. Jinými slovy, jaká je síla našeho testu pro určení rozdílu mezi dvěma populacemi (H0 a HA), pokud takový rozdíl existuje?“
- Síla (1-β): pravděpodobnost správného zamítnutí nulové hypotézy (když nulová hypotéza není pravdivá).
- Chyba typu II (β): pravděpodobnost správného nezamítnutí nulové hypotézy (když nulová hypotéza není pravdivá).
Existují čtyři vzájemně propojené složky výkonu:
- B: beta (β), protože výkon je 1-β
- E: velikost účinku, rozdíl mezi průměry výběrových rozdělení H0 a HAlt. Čím větší je rozdíl mezi těmito dvěma průměry, tím větší sílu bude mít váš test k detekci rozdílu. Matematicky se zapisuje jako normalizovaný rozdíl (d) mezi průměry obou populací. d = (μ1-μ0)/σ.
- A: alfa (α), hodnota významnosti, která se obvykle stanovuje na 0,05, je to mezní hodnota, při které přijímáme nebo zamítáme naši nulovou hypotézu. Pokud je α menší (α = 0,1), je obtížnější zamítnout H0. Tím je síla menší.
- N: velikost vzorku (n). Čím větší je populace, tím menší je standardní chyba (SE = σ/√n). V podstatě se tím zužuje rozdělení vzorku, a proto je β menší.
Na videu opravdu pomáhá vidět tyto údaje graficky. Zkuste si nakreslit příklady, jak změna jednotlivých složek mění sílu, dokud to nepochopíte, a klidně se ptejte (v komentářích nebo e-mailem).
Klinická versus statistická významnost
Klinická významnost se liší od statistické významnosti. Rozdíl mezi průměry nebo účinek léčby může být statisticky významný, ale ne klinicky významný. Pokud je například vzorek dostatečně velký, mohou být statisticky významné i velmi malé rozdíly (např. změna hmotnosti o jednu libru, krevního tlaku o 1 mmHg), přestože nebudou mít žádný skutečný dopad na výsledky pacientů. Při hodnocení výsledků studií je tedy důležité věnovat pozornost jak klinické, tak statistické významnosti. Klinická významnost se určuje na základě klinického úsudku a také výsledků jiných studií, které prokazují následný klinický dopad krátkodobějších výsledků studie.
Testujte své porozumění
Při této úloze nastavené na výkon.
.