Normaalijakauma

Normaalijakauma on yleinen todennäköisyysjakauma . Sen muotoa kutsutaan usein ”kellokäyräksi”.

Monet arkipäiväiset tietoaineistot noudattavat tyypillisesti normaalijakaumaa: esimerkiksi aikuisten ihmisten pituudet, suurelle luokalle annetun kokeen pisteet, mittausvirheet.

Normaalijakauma on aina symmetrinen keskiarvon suhteen.

Keskihajonta on mitta sille, kuinka hajallaan normaalijakautunut aineisto on. Se on tilasto, joka kertoo, kuinka tiiviisti kaikki esimerkit ovat kerääntyneet keskiarvon ympärille aineistossa. Normaalijakauman muoto määräytyy keskiarvon ja keskihajonnan perusteella. Mitä jyrkempi kellokäyrä on, sitä pienempi on keskihajonta. Jos esimerkit ovat hajallaan toisistaan, kellokäyrä on paljon litteämpi, eli keskihajonta on suuri.

Yleensä noin 68 % normaalijakauman käyrän alaisesta pinta-alasta on yhden keskihajonnan sisällä keskiarvosta.

Eli jos x ¯ on jakauman keskiarvo ja σ on jakauman keskihajonta, niin 68 % arvoista sijoittuu välille ( x ¯ – σ ) ja ( x ¯ + σ ) . Alla olevassa kuvassa tämä vastaa vaaleanpunaisella tummennettua aluetta.

Noin 95 % arvoista sijaitsee kahden keskihajonnan sisällä keskiarvosta eli välillä ( x ¯ – 2 σ ) ja ( x ¯ + 2 σ ) .

(Kuvassa tämä on vaaleanpunaisen ja sinisen alueen summa: 34 % + 34 % + 13.5 % + 13.5 % = 95 % .)

Noin 99,7 % arvoista on kolmen keskihajonnan sisällä keskiarvosta eli välillä ( x ¯ – 3 σ ) ja ( x ¯ + 3 σ ) .

(Kuvassa vaaleanpunaiset, siniset ja vihreät alueet.)

(Huomaa, että nämä arvot ovat likiarvoja.)

Esimerkki 1:

Aineisto on normaalijakautunut ja sen keskiarvo on 5 . Kuinka monta prosenttia aineistosta on pienempi kuin 5 ?

Normaalijakauma on symmetrinen keskiarvon suhteen. Puolet aineistosta on siis pienempi kuin keskiarvo ja puolet aineistosta on suurempi kuin keskiarvo.

Näin ollen 50 % aineistosta on pienempi kuin 5 .

Esimerkki 2:

Täyteen ladatun matkapuhelimen akun käyttöikä on normaalisti jakautunut siten, että keskiarvo on 14 tuntia ja keskihajonta 1 tunti. Mikä on todennäköisyys sille, että akku kestää vähintään 13 tuntia?

Keskiarvo on 14 ja keskihajonta 1 .

50 % normaalijakaumasta sijaitsee keskiarvon oikealla puolella, joten 50 % ajasta akku kestää yli 14 tuntia.

Väli 13-14 tuntia edustaa yhtä keskihajontaa keskiarvosta vasemmalle. Noin 34 % ajasta akku kestää siis 13 ja 14 tunnin välillä.

Näin ollen todennäköisyys sille, että akku kestää vähintään 13 tuntia, on noin 34 % + 50 % eli 0,84 .

Esimerkki 3:

Vadelman keskipaino on 4,4 g ja keskihajonta 1,3 g. Mikä on todennäköisyys, että satunnaisesti valittu vadelma painaa vähintään 3,1 gm mutta enintään 7,0 gm?

Keskiarvo on 4,4 ja keskihajonta on 1,3 .

Huomaa, että

4,4 – 1,3 = 3,1

ja

4,4 + 2 ( 1,3 ) = 7,0

Joten väli 3,1 ≤ x ≤ 7,0 on itse asiassa yhden keskihajonnan verran keskiarvon alapuolella ja kaksi keskihajontaa keskiarvon yläpuolella.

Normaalisti jakautuneessa aineistossa noin 34 % arvoista on keskiarvon ja yhden keskihajonnan alapuolella ja 34 % keskiarvon ja yhden keskihajonnan yläpuolella.

Lisäksi 13,5 % arvoista sijaitsee ensimmäisen ja toisen keskihajonnan välissä keskiarvon yläpuolella.

Laskemalla alueet yhteen saadaan 34 % + 34 % + 13,5 % = 81,5 % .

Näin ollen todennäköisyys sille, että satunnaisesti valittu vadelma painaa vähintään 3,1 g mutta enintään 7,0 g, on 81,5 % eli 0,815 .

Esimerkki 4:

Eräässä kaupungissa on 330 000 aikuista. Heidän pituutensa on normaalijakautunut siten, että keskiarvo on 175 cm ja varianssi 100 cm 2 . Kuinka monen ihmisen odotetaan olevan pitempi kuin 205 cm?

Aineiston varianssin annetaan olevan 100 cm 2 . Keskihajonta on siis 100 eli 10 cm.

Nyt 175 + 3 ( 10 ) = 205 , joten yli 205 cm pitempien ihmisten määrä vastaa sitä aineiston osajoukkoa, joka sijaitsee yli 3 keskihajontaa keskiarvon yläpuolella.

Yllä olevasta kuvaajasta nähdään, että tämä edustaa noin 0,15 % aineistosta. Tämä prosenttiosuus on kuitenkin likimääräinen, ja tässä tapauksessa tarvitsemme enemmän tarkkuutta. Todellinen prosenttiosuus neljän desimaalin tarkkuudella on 0,1318 % .

330 , 000 × 0.001318 ≈ 435

Kaupungissa on siis noin 435 ihmistä, jotka ovat pitempiä kuin 205 cm.

Vastaa

Sähköpostiosoitettasi ei julkaista.