Błąd typu I i błąd typu II
Pamiętasz, że błąd typu II jest prawdopodobieństwem przyjęcia hipotezy zerowej (lub innymi słowy „nieodrzucenia hipotezy zerowej”), gdy w rzeczywistości powinniśmy byli ją odrzucić. Prawdopodobieństwo to oznaczane jest literą β. Z kolei odrzucenie hipotezy zerowej, gdy tak naprawdę nie powinniśmy byli jej odrzucać, jest błędem typu I i oznaczane jest literą α. W tym filmie zobaczysz obrazowo, gdzie te wartości znajdują się na rysunku dwóch rozkładów H0 będącego prawdą i HAlt będącego prawdą.
- Błąd typu I (α): błędnie odrzucamy H0, mimo że hipoteza zerowa jest prawdziwa.
- Błąd typu II (β): błędnie akceptujemy (lub „nie odrzucamy”) H0, mimo że hipoteza alternatywna jest prawdziwa.
An Error Mnemonic
Alternate hypothesis (Ha): there is a wolf
Null hypothesis (H0): there is no wolf
- Type I error (α): my incorrectly reject the null hypothesis, that there isn’t a wolf (i.e., wierzymy, że jest wilk), mimo że hipoteza zerowa jest prawdziwa (nie ma wilka).
- Błąd typu II (β): my błędnie przyjąć (lub „nie odrzucić”) hipotezę zerową (nie ma wilka), mimo że hipoteza alternatywna jest prawdziwa (jest wilk).
Moc statystyczna
Moc testu to prawdopodobieństwo, że test odrzuci hipotezę zerową, gdy hipoteza alternatywna jest prawdziwa. Innymi słowy, prawdopodobieństwo, że nie popełnimy błędu typu II. Innymi słowy, jaka jest moc naszego testu do wyznaczenia różnicy między dwiema populacjami (H0 i HA), jeśli taka różnica istnieje?
- Moc (1-β): prawdopodobieństwo poprawnego odrzucenia hipotezy zerowej (gdy hipoteza zerowa nie jest prawdziwa).
- Błąd typu II (β): prawdopodobieństwo nieudanego odrzucenia hipotezy zerowej (gdy hipoteza zerowa nie jest prawdziwa).
Istnieją cztery powiązane ze sobą składniki mocy:
- B: beta (β), ponieważ moc jest równa 1-β
- E: wielkość efektu, różnica między średnimi rozkładów próbkowania H0 i HAlt. Im większa różnica między tymi dwiema średnimi, tym większą moc będzie miał test, aby wykryć różnicę. Jest to matematycznie zapisane jako znormalizowana różnica (d) między średnimi dwóch populacji. d = (μ1-μ0)/σ.
- A: alfa (α), wartość istotności, która jest zwykle ustawiona na 0,05, jest to granica, przy której akceptujemy lub odrzucamy naszą hipotezę zerową. Zmniejszanie α (α = 0.1) sprawia, że trudniej jest odrzucić H0. To sprawia, że moc jest mniejsza.
- N: wielkość próby (n). Im większa jest populacja, tym mniejszy staje się błąd standardowy (SE = σ/√n). Zasadniczo sprawia to, że rozkład próby jest węższy i dlatego β jest mniejsze.
Naprawdę pomaga zobaczyć to graficznie w filmie. Spróbuj narysować przykłady każdego z nich, jak zmiana każdego składnika zmienia moc, dopóki tego nie zrozumiesz, i nie krępuj się zadawać pytań (w komentarzach lub przez e-mail).
Clinical versus Statistical Significance
Clinical significance różni się od statistical significance. Różnica między środkami lub efektem leczenia może być statystycznie istotna, ale nie klinicznie znacząca. Na przykład, jeśli wielkość próby jest wystarczająco duża, bardzo małe różnice mogą być istotne statystycznie (np. zmiana wagi o 1 funt, ciśnienie krwi o 1 mmHg), mimo że nie będą miały rzeczywistego wpływu na wyniki pacjenta. Dlatego ważne jest, aby przy ocenie wyników badania zwracać uwagę zarówno na istotność kliniczną, jak i statystyczną. Znaczenie kliniczne określa się na podstawie osądu klinicznego, a także wyników innych badań, które wykazują dalszy wpływ kliniczny krótszych wyników badania.
Sprawdź swoje zrozumienie
Przy tym problemie należy ustawić na moc.
.