Miért nem utasítják el mindig a nullát a ravasz szakértők

A múltkor megnéztem egy régi motoros filmet az 1960-as évekből, és megdöbbentett a motorosok szlengje. Volt egy saját nyelvük. Akárcsak a statisztikusoknak, akiknek a beszédmódja gyakran zavarba hozza azokat, akik nem ismerik az adatelemzés nyelvezetét.

Ez elgondolkodtatott… mi lenne, ha lenne egy kizárólag statisztikusokból álló motoros banda? Hívjuk őket a Nulls Angels-nek. Képzeljük el őket a színeikben, ahogy száguldoznak a vidéken, adatokat elemeznek, és megkérdezik az embereket, akikkel az úton találkoznak, hogy “nem utasítják-e el a nullhipotézist.”

Ha rámutatsz, milyen furcsán hangzik ez a kifejezés, a Nulls Angels tudni fogja, hogy nem vagy menő… és nem nagyon ismered a statisztikát.

Pusztán szerkesztőként szólva, elismerem, hogy a “nem utasítják el a nullhipotézist” visszataszító. A “Failing to reject” túlságosan bonyolult egyenértékűnek tűnik az elfogadáshoz. Legalábbis ez egy nehézkes megfogalmazás.

De kiderült, hogy a null-angyalok durva és készséges statisztikusainak jó okuk van arra, hogy így beszéljenek. Statisztikai szempontból ez tagadhatatlanul pontos – és az “elutasíthatatlanság” “elfogadással” való helyettesítése egyszerűen helytelen lenne.

Mi egyébként a nullhipotézis?

A hipotézisvizsgálatok közé tartoznak az egy- és kétmintás t-tesztek, az asszociációs tesztek, a normalitásvizsgálatok és még sok más. (Ezek a tesztek mindegyike elérhető a Minitab statisztikai szoftver Stat menüpontjában. Vagy ha egy kicsit több statisztikai útmutatásra van szüksége, az Asszisztens lépésről lépésre végigvezetheti a gyakori hipotézisvizsgálatokon.)

A hipotézisvizsgálat két állítást vizsgál: a nullhipotézist (röviden H0) és az alternatívát (H1). Az alternatív hipotézis az, amit remélünk alátámasztani. Feltételezzük, hogy a nullhipotézis igaz, hacsak az adatok nem szolgáltatnak elegendő bizonyítékot arra, hogy ez nem így van.

A “ártatlan, amíg bűnössége be nem bizonyosodik” kifejezést már hallotta. Ez azt jelenti, hogy a vádlott ártatlanságát természetesnek vesszük, amíg a bűnösségét be nem bizonyítják. A statisztikában a nullhipotézist természetesnek vesszük, amíg az alternatívát igaznak nem bizonyítják.”

Miért “nem utasítjuk el” a nullhipotézist?

Ez felveti a “bizonyítás” kérdését.”

A statisztikai bizonyíték mértéke, amelyre az alternatív hipotézis “bizonyításához” szükségünk van, a megbízhatósági szint. A megbízhatósági szint 1 mínusz az I. típusú hiba elkövetésének kockázata, ami akkor következik be, ha tévesen utasítunk el egy igaz nullhipotézist. A statisztikusok ezt a kockázatot alfának nevezik, és szignifikancia szintnek is nevezik. A tipikus 0,05-ös alfa 95%-os megbízhatósági szintnek felel meg: 5%-os esélyt fogadunk el a nullhipotézis elutasítására, még akkor is, ha az igaz. (Élet-halál kérdésekben az I. típusú hiba kockázatát 1%-ra vagy kevesebbre csökkenthetjük.)

A választott alfa-szinttől függetlenül minden hipotézisvizsgálatnak csak két lehetséges kimenetele van:

  1. Elutasítjuk a nullhipotézist, és arra következtetünk, hogy az alternatív hipotézis igaz a 95%-os megbízhatósági szinten (vagy bármilyen választott szinten).
  2. Nem utasítjuk el a nullhipotézist, és arra következtetünk, hogy nem áll rendelkezésre elég bizonyíték ahhoz, hogy a 95%-os megbízhatósági szinten a nullhipotézis hamis legyen.

Gyakran használjuk a p-értéket annak eldöntésére, hogy az adatok alátámasztják-e a nullhipotézist vagy sem. Ha a teszt p-értéke kisebb, mint az általunk kiválasztott alfa-szint, akkor elutasítjuk a nullhipotézist. Vagy ahogy a statisztikusok mondják: “Ha a p-érték alacsony, a nullának mennie kell.”

Ez még mindig nem magyarázza meg, hogy egy statisztikus miért nem “fogadja el a nullhipotézist”. Itt a lényeg: a nullhipotézis elutasításának elmaradása nem bizonyítja, hogy a nullhipotézis igaz. Ez azért van, mert egy hipotézisvizsgálat nem határozza meg, hogy melyik hipotézis igaz, sőt még azt sem, hogy melyik a legvalószínűbb: csak azt értékeli, hogy van-e bizonyíték a nullhipotézis elutasítására.”

“Null, amíg nem bizonyított az alternatíva”

Visszatérve az “ártatlan, amíg nem bizonyított a bűnösség” kifejezésre. Adatelemzőként Ön a bíró. A hipotézisvizsgálat a tárgyalás, a nullhipotézis pedig a vádlott. Az alternatív hipotézis a vád, amelynek minden kétséget kizáróan (mondjuk, 95%-os bizonyossággal) bizonyítania kell az ügyét.

Ha a tárgyalás bizonyítékai nem bizonyítják a vádlott bűnösségét, akkor az sem bizonyította, hogy a vádlott ártatlan. A rendelkezésre álló bizonyítékok alapján azonban nem lehet elvetni ezt a lehetőséget. Hogyan hirdetné ki tehát az ítéletét?

“Nem bűnös.”

Ez a mondat tökéletes: “Nem bűnös “nem azt mondja, hogy a vádlott ártatlan, mert ez nem bizonyított. Csak azt mondja, hogy az ügyészség nem tudta meggyőzni a bírót, hogy hagyjon fel az ártatlanság feltételezésével.

A “nem sikerült elutasítani a nullát” tehát a “nem bűnös” statisztikai megfelelője. Egy tárgyaláson a bizonyítási teher a vádat terheli. Az adatok elemzésekor a teljes bizonyítási teher a mintaadatokra hárul. A “nem bűnös” nem jelenti azt, hogy “ártatlan”, és a nullhipotézis “el nem vetése” egészen más, mint annak “elfogadása”.

Ha tehát a null angyalok bőrébe bújtatott martalóc statisztikusok egy csoportja valaha is megkérdezi, tartsa magát a kegyeikben, és mutassa meg, hogy tudja, hogy “a nullhipotézis elutasításának elmulasztása” nem “a nullhipotézis elfogadása”

.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.