Why Shrewd Experts "Fail to Reject the Null" Every Time

Oglądałem stary motocyklowy film z lat 60-tych ubiegłej nocy i uderzył mnie slang motocyklistów. Mieli swój własny język. Zupełnie jak statystycy, których sposób mówienia często wprawia w zakłopotanie tych, którzy nie znają języka analizy danych.

Wpadło mi to do głowy…co by było, gdyby istniał gang motocyklistów-statystyków? Nazwijmy ich Aniołami Nullsa. Wyobraź sobie ich w swoich barwach, przemierzających krajobrazy, analizujących dane i pytających ludzi, których spotykają na drodze o to, czy „nie odrzucają hipotezy zerowej.”

Jeśli zwrócisz uwagę na to, jak dziwnie brzmi to wyrażenie, Nulls Angels będą wiedzieć, że nie jesteś fajny… i niezbyt świadomy statystyk.

Mówiąc wyłącznie jako redaktor, przyznaję, że „nie odrzucając hipotezy zerowej” jest godne pożałowania. „Niepowodzenie w odrzuceniu” wydaje się zbyt skomplikowanym odpowiednikiem akceptacji. At minimum, it’s clunky phrasing.

But it turns out those rough-and-ready statisticians in the Nulls Angels have good reason to talk like that. Ze statystycznego punktu widzenia, jest to niezaprzeczalnie dokładne i zastąpienie „braku odrzucenia” przez „akceptację” byłoby po prostu błędne.

Co to w ogóle jest hipoteza zerowa?

Testy hipotez obejmują testy t jedno- i dwupróbkowe, testy asocjacji, testy normalności i wiele innych. (Wszystkie te testy są dostępne w menu Stat w programie statystycznym Minitab. Jeśli użytkownik potrzebuje nieco więcej wskazówek statystycznych, Asystent może przeprowadzić go krok po kroku przez typowe testy hipotez.)

Test hipotezy bada dwie propozycje: hipotezę zerową (w skrócie H0) i alternatywną (H1). Hipoteza alternatywna jest tym, co mamy nadzieję poprzeć. Zakładamy, że hipoteza zerowa jest prawdziwa, chyba że dane dostarczają wystarczających dowodów na to, że tak nie jest.

Słyszałeś wyrażenie „Niewinny do czasu udowodnienia winy”. Oznacza to, że niewinność oskarżonego jest uznawana za pewnik, dopóki wina nie zostanie udowodniona. W statystyce, hipoteza zerowa jest uznawana za pewnik, dopóki hipoteza alternatywna nie zostanie udowodniona jako prawdziwa.

Dlaczego więc „nie udaje nam się odrzucić” hipotezy zerowej?

W tym miejscu pojawia się kwestia „dowodu.”

Stopień dowodu statystycznego, którego potrzebujemy, aby „udowodnić” hipotezę alternatywną to poziom ufności. Poziom ufności to 1 minus nasze ryzyko popełnienia błędu typu I, który występuje, gdy nieprawidłowo odrzucimy hipotezę zerową, która jest prawdziwa. Statystycy nazywają to ryzyko alfa i odnoszą się do niego również jako do poziomu istotności. Typowa alfa równa 0,05 odpowiada poziomowi ufności 95%: akceptujemy 5% szans na odrzucenie hipotezy zerowej, nawet jeśli jest ona prawdziwa (w sprawach dotyczących życia lub śmierci możemy obniżyć ryzyko błędu typu I do 1% lub mniej).)

Bez względu na wybrany przez nas poziom alfa, każdy test hipotezy ma tylko dwa możliwe wyniki:

Odrzucenie hipotezy zerowej i stwierdzenie, że hipoteza alternatywna jest prawdziwa na 95% poziomie ufności (lub innym wybranym przez nas poziomie).
Nie odrzucić hipotezy zerowej i stwierdzić, że nie ma wystarczających dowodów na to, że hipoteza zerowa jest fałszywa na 95% poziomie ufności.

Często używamy wartości p, aby zdecydować, czy dane potwierdzają hipotezę zerową czy nie. Jeśli wartość p testu jest mniejsza niż wybrany przez nas poziom alfa, odrzucamy hipotezę zerową. Lub, jak mówią statystycy „Kiedy wartość p jest niska, hipoteza zerowa musi odejść.”

To nadal nie wyjaśnia, dlaczego statystyk nie „zaakceptuje hipotezy zerowej”. Oto sedno sprawy: brak odrzucenia hipotezy zerowej nie dowodzi, że hipoteza zerowa jest prawdziwa. To dlatego, że test hipotezy nie określa, która hipoteza jest prawdziwa, a nawet która jest najbardziej prawdopodobna: ocenia tylko, czy istnieją dowody na odrzucenie hipotezy zerowej.

„Null Until Proved Alternative”

Powróć do „niewinny dopóki nie udowodni się winy”. Jako analityk danych, jesteś sędzią. Test hipotezy to proces, a hipoteza zerowa to oskarżony. Hipotezą alternatywną jest oskarżenie, które musi udowodnić swój przypadek ponad wszelką wątpliwość (powiedzmy, z 95% pewnością).

Jeśli dowody procesowe nie wykazują, że pozwany jest winny, nie wykazały również, że pozwany jest niewinny. Jednakże, na podstawie dostępnych dowodów, nie możesz odrzucić takiej możliwości. Jak więc ogłosiłbyś swój werdykt?

„Niewinny.”

To zdanie jest doskonałe: „Niewinny” nie mówi, że oskarżony jest niewinny, ponieważ nie zostało to udowodnione. Mówi tylko, że oskarżenie nie mogło przekonać sędziego do porzucenia założenia o niewinności.

Więc „brak odrzucenia zera” jest statystycznym odpowiednikiem „nie winny”. W procesie sądowym, ciężar dowodu spada na oskarżenie. Podczas analizowania danych, cały ciężar dowodu spada na twoje przykładowe dane. „Niewinny” nie oznacza „niewinny”, a „nieodrzucenie” hipotezy zerowej jest całkiem odmienne od „przyjęcia” jej.

Więc, jeśli grupa maruderów statystyków w swoich skórach Nulls Angels kiedykolwiek zapyta, zachowaj się w ich dobrych łaskach i pokaż, że wiesz, że „nieodrzucenie hipotezy zerowej” nie jest „akceptacją zera.”

Why Shrewd Experts „Fail to Reject the Null” Every Time

Co to w ogóle jest hipoteza zerowa?

Dlaczego więc „nie udaje nam się odrzucić” hipotezy zerowej?

„Null Until Proved Alternative”

Dodaj komentarz Anuluj pisanie odpowiedzi