Ich habe neulich einen alten Motorradfilm aus den 1960er Jahren gesehen, und mir ist der Slang der Biker aufgefallen. Sie hatten eine ganz eigene Sprache. Genau wie die Statistiker, deren Art zu sprechen oft diejenigen verwirrt, die mit dem Jargon der Datenanalyse nicht vertraut sind.
Das brachte mich zum Nachdenken… was wäre, wenn es eine Biker-Gang gäbe, die nur aus Statistikern besteht? Nennen wir sie die Nulls Angels. Stell dir vor, wie sie in ihren Farben durch die Lande fahren, Daten analysieren und die Leute, denen sie auf der Straße begegnen, fragen, ob sie „die Nullhypothese nicht ablehnen“.
Wenn du darauf hinweist, wie seltsam dieser Satz klingt, wissen die Nulls Angels, dass du nicht cool bist… und nicht viel von Statistik verstehst.
Als reiner Redakteur gebe ich zu, dass „die Nullhypothese nicht ablehnen“ unangenehm ist. „Die Nullhypothese nicht zurückweisen“ scheint ein zu kompliziertes Äquivalent zu sein. Zumindest ist es eine klobige Formulierung.
Aber es stellt sich heraus, dass die raubeinigen Statistiker in den Nulls Angels guten Grund haben, so zu reden. Aus statistischer Sicht ist es unbestreitbar richtig – und „nicht zurückweisen“ durch „akzeptieren“ zu ersetzen, wäre einfach falsch.
Was ist die Nullhypothese überhaupt?
Hypothesentests umfassen t-Tests mit einer und zwei Stichproben, Tests auf Assoziation, Tests auf Normalität und viele mehr. (Alle diese Tests sind in der Statistiksoftware Minitab im Menü Stat verfügbar. Wenn Sie etwas mehr statistische Anleitung benötigen, kann der Assistent Sie Schritt für Schritt durch gängige Hypothesentests führen.)
Ein Hypothesentest prüft zwei Aussagen: die Nullhypothese (oder kurz H0) und die Alternative (H1). Die Alternativhypothese ist das, was wir zu bestätigen hoffen. Wir nehmen an, dass die Nullhypothese wahr ist, es sei denn, die Daten liefern ausreichende Beweise für das Gegenteil.
Sie kennen den Satz „Unschuldig, bis die Schuld bewiesen ist“. Das bedeutet, dass die Unschuld des Angeklagten so lange angenommen wird, bis die Schuld bewiesen ist. In der Statistik wird die Nullhypothese so lange als gegeben angenommen, bis die Alternative bewiesen ist.
Warum wird die Nullhypothese nicht verworfen?
Damit stellt sich die Frage nach dem „Beweis“.
Das Maß an statistischer Evidenz, das wir brauchen, um die Alternativhypothese zu „beweisen“, ist das Konfidenzniveau. Das Konfidenzniveau ist 1 minus das Risiko eines Fehlers vom Typ I, der auftritt, wenn man eine wahre Nullhypothese fälschlicherweise ablehnt. Statistiker nennen dieses Risiko Alpha und bezeichnen es auch als Signifikanzniveau. Das typische Alpha von 0,05 entspricht einem Konfidenzniveau von 95 %: Wir akzeptieren eine 5 %ige Chance, die Nullhypothese abzulehnen, selbst wenn sie wahr ist. (Wenn es um Leben und Tod geht, können wir das Risiko eines Fehlers vom Typ I auf 1 % oder weniger senken.)
Ungeachtet des gewählten Alpha-Niveaus gibt es bei jedem Hypothesentest nur zwei mögliche Ergebnisse:
- Die Nullhypothese wird abgelehnt, und die Alternativhypothese ist mit einem Konfidenzniveau von 95 % (oder dem von Ihnen gewählten Niveau) wahr.
- Die Nullhypothese kann nicht zurückgewiesen werden, und es liegen nicht genügend Beweise vor, um die Nullhypothese mit einem Konfidenzniveau von 95 % für falsch zu halten.
Häufig wird ein p-Wert verwendet, um zu entscheiden, ob die Daten die Nullhypothese unterstützen oder nicht. Wenn der p-Wert des Tests kleiner ist als das von uns gewählte Alpha-Niveau, verwerfen wir die Nullhypothese. Oder, wie Statistiker sagen: „Wenn der p-Wert niedrig ist, muss die Nullhypothese akzeptiert werden.“
Das erklärt immer noch nicht, warum ein Statistiker die Nullhypothese nicht „akzeptiert“. Hier ist die Quintessenz: Wenn die Nullhypothese nicht abgelehnt wird, beweist das nicht, dass die Nullhypothese wahr ist. Das liegt daran, dass ein Hypothesentest nicht feststellt, welche Hypothese wahr oder sogar am wahrscheinlichsten ist: Er bewertet nur, ob es Beweise gibt, um die Nullhypothese abzulehnen.
„Null, bis die Alternative bewiesen ist“
Hinweis auf „unschuldig, bis die Schuld bewiesen ist“. Als Datenanalytiker sind Sie der Richter. Der Hypothesentest ist der Prozess, und die Nullhypothese ist der Angeklagte. Die Alternativhypothese ist die Staatsanwaltschaft, die ihre Argumente zweifelsfrei (z. B. mit 95 %iger Sicherheit) darlegen muss.
Wenn die Beweise in der Verhandlung nicht zeigen, dass der Angeklagte schuldig ist, haben sie auch nicht bewiesen, dass der Angeklagte unschuldig ist. Auf der Grundlage der vorliegenden Beweise können Sie diese Möglichkeit jedoch nicht ausschließen. Wie würden Sie also Ihr Urteil verkünden?
„Nicht schuldig.“
Dieser Satz ist perfekt: „Nicht schuldig“ bedeutet nicht, dass der Angeklagte unschuldig ist, denn das wurde nicht bewiesen. Es besagt nur, dass die Staatsanwaltschaft den Richter nicht davon überzeugen konnte, die Unschuldsvermutung aufzugeben.
Das statistische Äquivalent von „nicht schuldig“ ist also „Nichtverwerfung der Null“. In einem Prozess liegt die Beweislast bei der Staatsanwaltschaft. Bei der Analyse von Daten liegt die gesamte Beweislast bei Ihren Stichprobendaten. „Nicht schuldig“ bedeutet nicht „unschuldig“, und die Nullhypothese nicht zu verwerfen ist etwas ganz anderes als sie zu „akzeptieren“.
Wenn also eine Gruppe marodierender Statistiker in ihren „Nulls Angels“-Ledern jemals fragen sollte, halten Sie sich in deren Gunst und zeigen Sie, dass Sie wissen, dass „die Nullhypothese nicht zurückweisen“ nicht „die Nullhypothese akzeptieren“ bedeutet.“