Distribution normale des données

Une distribution normale est une distribution de probabilité courante . Elle a une forme souvent appelée « courbe en cloche ».

De nombreux ensembles de données de la vie courante suivent généralement une distribution normale : par exemple, les hauteurs des humains adultes, les notes d’un test donné à une grande classe, les erreurs de mesure.

La distribution normale est toujours symétrique par rapport à la moyenne.

L’écart-type est la mesure de la dispersion d’un ensemble de données normalement distribuées. Il s’agit d’une statistique qui vous indique à quel point tous les exemples sont rassemblés autour de la moyenne dans un ensemble de données. La forme d’une distribution normale est déterminée par la moyenne et l’écart-type. Plus la courbe en cloche est pentue, plus l’écart-type est faible. Si les exemples sont très dispersés, la courbe en cloche sera beaucoup plus plate, ce qui signifie que l’écart-type est important.

En général, environ 68 % de l’aire sous une courbe de distribution normale se situe dans un écart-type de la moyenne.

C’est-à-dire que si x ¯ est la moyenne et σ l’écart-type de la distribution, alors 68 % des valeurs se situent dans l’intervalle compris entre ( x ¯ – σ ) et ( x ¯ + σ ) . Dans la figure ci-dessous, cela correspond à la région ombrée en rose.

Environ 95 % des valeurs se situent à moins de deux écarts types de la moyenne, c’est-à-dire entre ( x ¯ – 2 σ ) et ( x ¯ + 2 σ ) .

(Sur la figure, il s’agit de la somme des régions rose et bleue : 34 % + 34 % + 13.5 % + 13.5 % = 95 % .)

Environ 99,7 % des valeurs se situent à moins de trois écarts types de la moyenne, c’est-à-dire entre ( x ¯ – 3 σ ) et ( x ¯ + 3 σ ) .

(Les régions rose, bleue et verte dans la figure.)

(Notez que ces valeurs sont approximatives.)

Exemple 1 :

Un ensemble de données est normalement distribué avec une moyenne de 5 . Quel pourcentage des données est inférieur à 5 ?

Une distribution normale est symétrique par rapport à la moyenne. Ainsi, la moitié des données sera inférieure à la moyenne et la moitié des données sera supérieure à la moyenne.

Donc, 50 % des données sont inférieures à 5 .

Exemple 2 :

La durée de vie d’une batterie de téléphone portable entièrement chargée est normalement distribuée avec une moyenne de 14 heures et un écart type de 1 heure. Quelle est la probabilité qu’une batterie dure au moins 13 heures ?

La moyenne est de 14 et l’écart-type est de 1 .

50 % de la distribution normale se situe à droite de la moyenne, donc 50 % du temps, la batterie durera plus de 14 heures.

L’intervalle de 13 à 14 heures représente un écart type à gauche de la moyenne. Donc, environ 34 % du temps, la batterie durera entre 13 et 14 heures.

Par conséquent, la probabilité que la batterie dure au moins 13 heures est d’environ 34 % + 50 % ou 0,84 .

Exemple 3 :

Le poids moyen d’une framboise est de 4,4 gm avec un écart type de 1,3 gm. Quelle est la probabilité qu’une framboise choisie au hasard pèse au moins 3,1 gm mais pas plus de 7,0 gm ?

La moyenne est de 4,4 et l’écart-type est de 1,3 .

Notez que

4,4 – 1,3 = 3,1

et

4,4 + 2 ( 1,3 ) = 7,0

Donc, l’intervalle 3,1 ≤ x ≤ 7,0 est en fait compris entre un écart-type au-dessous de la moyenne et 2 écarts-types au-dessus de la moyenne.

Dans des données normalement distribuées, environ 34 % des valeurs se situent entre la moyenne et un écart-type au-dessous de la moyenne, et 34 % entre la moyenne et un écart-type au-dessus de la moyenne.

En outre, 13,5 % des valeurs se situent entre le premier et le deuxième écart-type au-dessus de la moyenne.

En additionnant les aires, on obtient 34 % + 34 % + 13,5 % = 81,5 % .

Par conséquent, la probabilité qu’une framboise choisie au hasard pèse au moins 3,1 gm mais pas plus de 7,0 gm est de 81,5 % ou 0,815 .

Exemple 4 :

Une ville compte 330 000 adultes. Leurs hauteurs sont normalement distribuées avec une moyenne de 175 cm et une variance de 100 cm 2 . Combien de personnes devraient avoir une taille supérieure à 205 cm ?

La variance de l’ensemble des données est donnée comme étant de 100 cm 2 . Donc, l’écart-type est de 100 ou 10 cm.

Or, 175 + 3 ( 10 ) = 205 , donc le nombre de personnes plus grandes que 205 cm correspond au sous-ensemble de données qui se situe à plus de 3 écarts types au-dessus de la moyenne.

Le graphique ci-dessus montre que cela représente environ 0,15 % des données. Cependant, ce pourcentage est approximatif, et dans ce cas, nous avons besoin de plus de précision. Le pourcentage réel, correct à 4 décimales près, est de 0,1318 % .

330 000 × 0,001318 ≈ 435

Donc, il y aura environ 435 personnes dans la ville qui ont une taille supérieure à 205 cm.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.