Distribuția normală a datelor

O distribuție normală este o distribuție de probabilitate comună . Ea are o formă denumită adesea „curbă în clopot”.

Multe seturi de date din viața de zi cu zi urmează de obicei o distribuție normală: de exemplu, înălțimile oamenilor adulți, notele la un test dat unei clase mari, erorile din măsurători.

Distribuția normală este întotdeauna simetrică în jurul mediei.

Abaterea standard este măsura cât de împrăștiat este un set de date cu distribuție normală. Este o statistică care vă spune cât de aproape sunt adunate toate exemplele în jurul mediei într-un set de date. Forma unei distribuții normale este determinată de medie și de abaterea standard. Cu cât curba în clopot este mai abruptă, cu atât deviația standard este mai mică. Dacă exemplele sunt foarte îndepărtate, curba clopotului va fi mult mai plată, ceea ce înseamnă că abaterea standard este mare.

În general, aproximativ 68 % din aria de sub curba unei distribuții normale se află în interiorul unei deviații standard a mediei.

Adică, dacă x ¯ este media și σ este abaterea standard a distribuției, atunci 68 % din valori se încadrează în intervalul dintre ( x ¯ – σ ) și ( x ¯ + σ ) . În figura de mai jos, acest lucru corespunde regiunii umbrite în roz.

Aproximativ 95 % din valori se situează în interiorul a două abateri standard de la medie, adică între ( x ¯ – 2 σ ) și ( x ¯ + 2 σ ) .

(În figură, aceasta este suma regiunilor roz și albastre: 34 % + 34 % + 13.5 % + 13.5 % = 95 % .)

Aproximativ 99,7 % din valori se situează în limita a trei abateri standard de la medie, adică între ( x ¯ – 3 σ ) și ( x ¯ + 3 σ ) .

(Regiunile roz, albastre și verzi din figură.)

(Rețineți că aceste valori sunt aproximative.)

Exemplul 1:

Un set de date este distribuit în mod normal cu o medie de 5 . Ce procent din date este mai mic de 5 ?

O distribuție normală este simetrică în jurul mediei. Deci, jumătate din date vor fi mai mici decât media și jumătate din date vor fi mai mari decât media.

Prin urmare, 50 % din date sunt mai mici decât 5 .

Exemplul 2:

Durata de viață a unei baterii de telefon mobil complet încărcate este distribuită normal, cu o medie de 14 ore și o abatere standard de 1 oră. Care este probabilitatea ca o baterie să dureze cel puțin 13 ore?

Media este 14 și abaterea standard este 1 .

50 % din distribuția normală se află la dreapta mediei, deci, în 50 % din cazuri, bateria va dura mai mult de 14 ore.

Intervalul de la 13 la 14 ore reprezintă o abatere standard la stânga mediei. Așadar, în aproximativ 34 % din timp, bateria va dura între 13 și 14 ore.

Prin urmare, probabilitatea ca bateria să dureze cel puțin 13 ore este de aproximativ 34 % + 50 % sau 0,84 .

Exemplul 3:

Greutatea medie a unei zmeură este de 4,4 gm cu o deviație standard de 1,3 gm. Care este probabilitatea ca o zmeură aleasă la întâmplare să cântărească cel puțin 3,1 gm, dar nu mai mult de 7,0 gm?

Media este de 4,4 și abaterea standard este de 1,3 .

Rețineți că

4.4 – 1.3 = 3.1

și

4.4 + 2 ( 1.3 ) = 7.0

Deci, intervalul 3.1 ≤ x ≤ 7.0 este de fapt cuprins între o abatere standard sub medie și 2 abateri standard deasupra mediei.

În cazul datelor distribuite normal, aproximativ 34 % din valori se situează între medie și o abatere standard sub medie și 34 % între medie și o abatere standard deasupra mediei.

În plus, 13,5 % din valori se situează între prima și a doua abatere standard deasupra mediei.

Adăugând suprafețele, obținem 34 % + 34 % + 13,5 % = 81,5 % .

Prin urmare, probabilitatea ca o zmeură aleasă la întâmplare să cântărească cel puțin 3,1 gm dar nu mai mult de 7,0 gm este 81,5 % sau 0,815 .

Exemplul 4:

Un oraș are 330.000 de adulți. Înălțimile lor sunt distribuite în mod normal, cu o medie de 175 cm și o varianță de 100 cm 2 .Câte persoane v-ați aștepta să fie mai înalte de 205 cm?

Se consideră că varianța setului de date este de 100 cm 2 . Așadar, abaterea standard este de 100 sau 10 cm.

Acum, 175 + 3 ( 10 ) = 205 , astfel încât numărul de persoane mai înalte de 205 cm corespunde subansamblului de date care se află cu mai mult de 3 abateri standard deasupra mediei.

Graficul de mai sus arată că acest lucru reprezintă aproximativ 0,15 % din date. Totuși, acest procent este aproximativ și, în acest caz, avem nevoie de mai multă precizie. Procentul real, corect cu 4 zecimale, este 0,1318 % .

330 , 000 × 0.001318 ≈ 435

Așadar, în oraș vor exista aproximativ 435 de persoane mai înalte de 205 cm.

Lasă un răspuns

Adresa ta de email nu va fi publicată.