Why Shrewd Experts ”Fail to Reject the Null” Every Time

Katsoin eräänä iltana vanhan moottoripyöräelokuvan 1960-luvulta, ja moottoripyöräilijöiden slangi teki minuun vaikutuksen. Heillä oli ihan oma kielensä. Aivan kuten tilastotieteilijöillä, joiden puhetapa usein hämmentää niitä, jotka eivät ole perehtyneet data-analyysin kielenkäyttöön.

Se sai minut miettimään…mitä jos olisi olemassa pelkästään tilastotieteilijöitä edustava prätkäjengi? Kutsutaan heitä Nulls Angelsiksi. Kuvitelkaa heidät väreissään ajelemassa pitkin maaseutua, analysoimassa dataa ja kyselemässä tiellä kohtaamiltaan ihmisiltä, ovatko he ”epäonnistuneet nollahypoteesin hylkäämisessä.”

Jos huomautat, kuinka oudolta tuo lause kuulostaa, Nulls Angels tietää, ettet ole siisti… etkä ole kovinkaan tietoinen tilastotieteestä.

Puhuakseni puhtaasti toimittajan ominaisuudessa, myönnän, että ”epäonnistuminen nollahypoteesin hylkäämisessä” on karmaisevasti sanottu. ”Failing to reject” tuntuu liian monimutkaiselta vastineelta hyväksyä. Vähintäänkin se on kömpelöä muotoilua.

Mutta käy ilmi, että noilla karkeilla tilastotieteilijöillä nolla-enkeleissä on hyvä syy puhua noin. Tilastollisesta näkökulmasta katsottuna se on kiistatta täsmällistä – ja ”hylkäämättömyyden” korvaaminen ”hyväksymisellä” olisi vain väärin.

Mikä on nollahypoteesi, Anyway?

Hypoteesitestejä ovat esimerkiksi yhden ja kahden otoksen t-testit, assosiointitestit, normaalisuustestit ja monet muut. (Kaikki nämä testit löytyvät Minitab-tilasto-ohjelmiston Stat-valikosta. Tai jos haluat hieman enemmän tilastollista opastusta, Assistentti voi opastaa sinut yleisimpien hypoteesitestien läpi askel askeleelta.)

Hypoteesitestissä tutkitaan kahta väitettä: nollahypoteesia (tai lyhyesti H0) ja vaihtoehtoa (H1). Vaihtoehtoinen hypoteesi on se, minkä toivomme saavan tukea. Oletamme, että nollahypoteesi on tosi, elleivät tiedot anna riittävää näyttöä siitä, että se ei ole totta.

Olet kuullut lauseen ”Syytön kunnes toisin todistetaan”. Se tarkoittaa, että vastaajan syyttömyyttä pidetään itsestäänselvyytenä, kunnes syyllisyys on todistettu. Tilastotieteessä nollahypoteesia pidetään itsestäänselvyytenä, kunnes vaihtoehtoinen hypoteesi on todistettu todeksi.

Miksi sitten ”hylkäämme” nollahypoteesin?

Tällöin nousee esiin kysymys ”todistamisesta”.

Vaihtoehtoisen hypoteesin ”todistamiseksi” tarvitsemamme tilastollisen todistusaineiston aste on luottamustaso. Luottamustaso on 1 miinus riskimme syyllistyä tyypin I virheeseen, joka tapahtuu, kun hylkäämme virheellisesti nollahypoteesin, joka on tosi. Tilastotieteilijät kutsuvat tätä riskiä alfaksi ja kutsuvat sitä myös merkitsevyystasoksi. Tyypillinen alfa 0,05 vastaa 95 prosentin luottamustasoa: hyväksymme 5 prosentin todennäköisyyden hylätä nollahypoteesi, vaikka se olisikin tosi. (Hengen tai kuoleman uhkaavissa asioissa saatamme alentaa tyypin I virheen riskin 1 prosenttiin tai vähemmän.)

Valitsemastamme alfatasosta riippumatta millä tahansa hypoteesitestillä on vain kaksi mahdollista lopputulosta:

  1. Hylkäämme nollahypoteesin ja päätämme, että vaihtoehtoinen hypoteesi on tosi 95 %:n luottamustasolla (tai millä tahansa valitsemallasi tasolla).
  2. Epäonnistut hylkäämään nollahypoteesin ja päättelet, että käytettävissä ei ole riittävästi todisteita, joiden perusteella nollahypoteesi olisi väärä 95 %:n luottamustasolla.

Käytämme usein p-arvoa päättäessämme, tukeeko aineisto nollahypoteesia vai ei. Jos testin p-arvo on pienempi kuin valitsemamme alfataso, hylkäämme nollahypoteesin. Tai kuten tilastotieteilijät sanovat: ”Kun p-arvo on pieni, nollahypoteesi on hylättävä.”

Tämä ei silti selitä, miksi tilastotieteilijä ei ”hyväksy nollahypoteesia”. Tässä on lopputulos: nollahypoteesin hylkäämättä jättäminen ei todista, että nollahypoteesi on tosi. Tämä johtuu siitä, että hypoteesitesti ei määrittele, mikä hypoteesi on tosi tai edes sitä, mikä on todennäköisin: se vain arvioi, onko olemassa todisteita nollahypoteesin hylkäämiseksi.

”Nollahypoteesi, kunnes vaihtoehto on todistettu”

Palataanpa takaisin sanaan ”syytön, kunnes syyllisyys on todistettu”. Tietoanalyytikkona sinä olet tuomari. Hypoteesitesti on oikeudenkäynti, ja nollahypoteesi on syytetty. Vaihtoehtoinen hypoteesi on syyttäjä, jonka on esitettävä väitteensä aukottomasti (vaikkapa 95 prosentin varmuudella).

Jos oikeudenkäynnin todistusaineisto ei osoita, että vastaaja on syyllinen, se ei myöskään ole osoittanut, että vastaaja on syytön. Käytettävissä olevien todisteiden perusteella tätä mahdollisuutta ei kuitenkaan voi hylätä. Miten siis ilmoittaisit tuomiosi?

”Syytön.”

Tämä lause on täydellinen: ”Syytön ”ei sano, että vastaaja on syytön, koska sitä ei ole todistettu. Se vain sanoo, että syyttäjä ei pystynyt vakuuttamaan tuomaria luopumaan syyttömyysolettamasta.

Siten ”nollatuloksen hylkäämättä jättäminen” on tilastollinen vastine sanalle ”ei syyllinen”. Oikeudenkäynnissä todistustaakka on syyttäjällä. Kun analysoidaan dataa, koko todistustaakka lankeaa otosdataan. ”Syytön” ei tarkoita ”syytön”, ja ”nollahypoteesin hylkäämättä jättäminen” on aivan eri asia kuin sen ”hyväksyminen”.

Jos siis joukko ryösteleviä tilastotieteilijöitä Nulls Angels -nahoissaan joskus kysyy, pidä itsesi heidän suosiossaan ja osoita, että tiedät, että ”nollahypoteesin hylkäämättä jättäminen” ei ole ”nollahypoteesin hyväksyminen”

.

Vastaa

Sähköpostiosoitettasi ei julkaista.