Nedávno jsem se díval na starý motocyklový film ze 60. let a zaujal mě slang motorkářů. Měli svůj vlastní jazyk. Stejně jako statistici, jejichž způsob mluvy často mate ty, kteří neovládají žargon analýzy dat.
Napadlo mě… co kdyby existoval motorkářský gang složený výhradně ze statistiků? Říkejme jim třeba Nuloví andělé. Představte si je, jak se ve svých barvách prohánějí krajinou, analyzují data a ptají se lidí, které na cestě potkají, jestli „nezamítají nulovou hypotézu“.
Pokud poukážete na to, jak divně ta věta zní, Nulls Angels budou vědět, že nejste cool… a že se ve statistice moc nevyznáte.
Mluvím-li čistě jako redaktor, uznávám, že „nezamítání nulové hypotézy“ je do očí bijící. „Selhání při zamítnutí“ mi připadá jako příliš komplikovaný ekvivalent k přijetí. Je to přinejmenším těžkopádná formulace.
Ale ukazuje se, že ti drsní statistici v Nulls Angels mají dobrý důvod takhle mluvit. Ze statistického hlediska je to nepopiratelně přesné – a nahradit „nezamítnutí“ slovem „přijetí“ by bylo prostě špatně.
Co je to vlastně nulová hypotéza?“
Mezi testy hypotéz patří jedno- a dvouvýběrové t-testy, testy asociace, testy normality a mnoho dalších. (Všechny tyto testy jsou k dispozici v nabídce Stat ve statistickém softwaru Minitab. Nebo pokud chcete získat více statistických pokynů, může vás asistent provést běžnými testy hypotéz krok za krokem)
Test hypotéz zkoumá dva předpoklady: nulovou hypotézu (zkráceně H0) a alternativu (H1). Alternativní hypotéza je to, co doufáme, že potvrdí. Předpokládáme, že nulová hypotéza je pravdivá, pokud data neposkytují dostatečné důkazy, že tomu tak není.
Slyšeli jste větu „Nevinen, dokud není prokázána jeho vina“. To znamená, že nevina obviněného se považuje za samozřejmost, dokud se neprokáže jeho vina. Ve statistice se nulová hypotéza považuje za samozřejmou, dokud se neprokáže pravdivost alternativní hypotézy.
Proč tedy „nezamítáme“ nulovou hypotézu?“
To přináší otázku „důkazu“.
Stupeň statistického důkazu, který potřebujeme k „prokázání“ alternativní hypotézy, je hladina spolehlivosti. Hladina spolehlivosti je 1 minus naše riziko, že se dopustíme chyby typu I, která nastane, když nesprávně zamítneme nulovou hypotézu, která je pravdivá. Statistici toto riziko nazývají alfa a označují ho také jako hladinu významnosti. Typická hodnota alfa 0,05 odpovídá 95% hladině spolehlivosti: připouštíme 5% pravděpodobnost zamítnutí nulové hypotézy, i když je pravdivá. (V případech, kdy jde o život, můžeme riziko chyby typu I snížit na 1 % nebo méně.)
Nezávisle na tom, jakou hladinu spolehlivosti alfa zvolíme, má každý test hypotézy pouze dva možné výsledky:
- Zamítneme nulovou hypotézu a dojdeme k závěru, že alternativní hypotéza je pravdivá na hladině spolehlivosti 95 % (nebo na jakékoli hladině, kterou jsme zvolili).
- Nezamítnete nulovou hypotézu a dojdete k závěru, že není k dispozici dostatek důkazů, které by naznačovaly, že nulová hypotéza je nepravdivá na 95% hladině spolehlivosti.
Často používáme p-hodnotu, abychom rozhodli, zda data potvrzují nulovou hypotézu, nebo ne. Pokud je p-hodnota testu menší než námi zvolená hladina alfa, nulovou hypotézu zamítneme. Nebo, jak říkají statistici: „Když je p-hodnota nízká, nulová hypotéza musí padnout.“
To stále nevysvětluje, proč statistik „nepřijme nulovou hypotézu“. Zde je podstata: nezamítnutí nulové hypotézy nedokazuje, že nulová hypotéza je pravdivá. Je to proto, že test hypotézy neurčuje, která hypotéza je pravdivá, nebo dokonce která je nejpravděpodobnější: pouze posuzuje, zda existují důkazy pro zamítnutí nulové hypotézy.
„Nulová až do prokázání alternativy“
Vraťme se k „nevinnému až do prokázání viny“. Jako datový analytik jste soudcem vy. Test hypotézy je soud a nulová hypotéza je obžalovaný. Alternativní hypotézou je obžaloba, která musí svůj případ prokázat nade vší pochybnost (řekněme s 95% jistotou).
Pokud důkazy v procesu neprokázaly vinu obžalovaného, neprokázaly ani to, že je obžalovaný nevinný. Na základě dostupných důkazů však nelze tuto možnost odmítnout. Jak byste tedy oznámili svůj rozsudek? „Nevinen.“
Tato věta je dokonalá: „Nevinen“ neříká, že obžalovaný je nevinný, protože to nebylo prokázáno. Říká pouze, že obžaloba nedokázala přesvědčit soudce, aby se vzdal předpokladu neviny.
Takže „neodmítnutí nulového předpokladu“ je statistickým ekvivalentem „nevinen“. V soudním řízení nese důkazní břemeno obžaloba. Při analýze dat nese celé důkazní břemeno váš vzorek dat. „Nevinen“ neznamená „nevinen“ a „nezamítnutí“ nulové hypotézy je zcela odlišné od jejího „přijetí“.
Takže pokud se vás někdy zeptá skupina nájezdných statistiků v kůžích Nulls Angels, zachovejte si jejich přízeň a ukažte, že víte, že „nezamítnutí nulové hypotézy“ není „přijetí nulové hypotézy“
.