Typ-I- und Typ-II-Fehler
Sie erinnern sich, dass der Typ-II-Fehler die Wahrscheinlichkeit ist, die Nullhypothese zu akzeptieren (oder mit anderen Worten „die Nullhypothese nicht abzulehnen“), obwohl wir sie eigentlich hätten ablehnen müssen. Diese Wahrscheinlichkeit wird durch den Buchstaben β gekennzeichnet. Im Gegensatz dazu ist die Ablehnung der Nullhypothese, wenn wir sie eigentlich nicht hätten ablehnen sollen, ein Fehler vom Typ I und wird durch α gekennzeichnet. In diesem Video werden Sie bildlich sehen, wo diese Werte auf einer Zeichnung der beiden Verteilungen von H0, die wahr sind, und HAlt, die wahr sind, liegen.
- Fehler vom Typ I (α): wir lehnen H0 fälschlicherweise ab, obwohl die Nullhypothese wahr ist.
- Fehler vom Typ II (β): Wir nehmen fälschlicherweise H0 an (oder „verwerfen nicht“), obwohl die Alternativhypothese wahr ist.
Ein Irrtum
Alternativhypothese (Ha): es gibt einen Wolf
Nullhypothese (H0): es gibt keinen Wolf
- Fehler vom Typ I (α): wir verwerfen fälschlicherweise die Nullhypothese, dass es keinen Wolf gibt (d.h.,
- Fehler vom Typ II (β): Wir nehmen die Nullhypothese (es gibt keinen Wolf) fälschlicherweise an (oder „verwerfen sie nicht“), obwohl die Alternativhypothese wahr ist (es gibt einen Wolf).
Statistische Aussagekraft
Die Aussagekraft eines Tests ist die Wahrscheinlichkeit, dass der Test die Nullhypothese zurückweist, wenn die Alternativhypothese wahr ist. Mit anderen Worten, die Wahrscheinlichkeit, keinen Fehler vom Typ II zu machen. Mit anderen Worten, wie hoch ist die Aussagekraft unseres Tests, um einen Unterschied zwischen zwei Populationen (H0 und HA) festzustellen, wenn ein solcher Unterschied besteht?
- Aussagekraft (1-β): die Wahrscheinlichkeit, dass die Nullhypothese korrekt zurückgewiesen wird (wenn die Nullhypothese nicht wahr ist).
- Fehler vom Typ II (β): die Wahrscheinlichkeit, die Nullhypothese nicht zurückzuweisen (wenn die Nullhypothese nicht wahr ist).
Es gibt vier miteinander verbundene Komponenten der Power:
- B: Beta (β), da die Power 1-β ist
- E: Effektgröße, der Unterschied zwischen den Mittelwerten der Stichprobenverteilungen von H0 und HAlt. Je größer der Unterschied zwischen diesen beiden Mittelwerten ist, desto mehr Power hat Ihr Test, um einen Unterschied festzustellen. Mathematisch wird dies als normalisierte Differenz (d) zwischen den Mittelwerten der beiden Populationen ausgedrückt. d = (μ1-μ0)/σ.
- A: Alpha (α), der Signifikanzwert, der in der Regel auf 0,05 festgelegt wird, d. h. die Grenze, ab der wir unsere Nullhypothese akzeptieren oder verwerfen. Je kleiner α ist (α = 0,1), desto schwieriger ist es, die H0 abzulehnen. Dadurch wird die Aussagekraft geringer.
- N: Stichprobenumfang (n). Je größer man die Grundgesamtheit macht, desto kleiner wird der Standardfehler (SE = σ/√n). Im Grunde genommen wird die Stichprobenverteilung dadurch enger und somit wird β kleiner.
Es ist sehr hilfreich, dies im Video grafisch darzustellen. Versuchen Sie, Beispiele dafür zu zeichnen, wie die Veränderung der einzelnen Komponenten die Aussagekraft verändert, bis Sie es verstanden haben, und stellen Sie gerne Fragen (in den Kommentaren oder per E-Mail).
Klinische versus statistische Signifikanz
Klinische Signifikanz ist etwas anderes als statistische Signifikanz. Ein Unterschied zwischen Mittelwerten oder ein Behandlungseffekt kann statistisch signifikant, aber nicht klinisch bedeutsam sein. Wenn die Stichprobengröße groß genug ist, können zum Beispiel sehr kleine Unterschiede statistisch signifikant sein (z. B. ein Pfund Gewichtsveränderung, 1 mmHg Blutdruck), obwohl sie keine wirklichen Auswirkungen auf die Patientenergebnisse haben. Daher ist es wichtig, bei der Bewertung von Studienergebnissen sowohl auf die klinische als auch auf die statistische Signifikanz zu achten. Die klinische Signifikanz wird anhand des klinischen Urteils sowie der Ergebnisse anderer Studien bestimmt, die die nachgelagerten klinischen Auswirkungen kurzfristigerer Studienergebnisse aufzeigen.
Testen Sie Ihr Verständnis
Bei diesem Problem steht die Leistung im Vordergrund.