Erreur de type I et de type II
Vous vous souviendrez que l’erreur de type II est la probabilité d’accepter l’hypothèse nulle (ou en d’autres termes « ne pas rejeter l’hypothèse nulle ») alors que nous aurions vraiment dû la rejeter. Cette probabilité est signifiée par la lettre β. A l’inverse, rejeter l’hypothèse nulle alors qu’on n’aurait vraiment pas dû est une erreur de type I et signifiée par α. Dans cette vidéo, vous verrez de manière imagée où se situent ces valeurs sur un dessin des deux distributions de H0 étant vraie et de HAlt étant vraie.
- Erreur de type I (α) : on rejette à tort H0 alors que l’hypothèse nulle est vraie.
- Erreur de type II (β) : nous acceptons incorrectement (ou « ne rejetons pas ») H0 même si l’hypothèse alternative est vraie.
Une erreur mnémotechnique
Hypothèse alternative (Ha) : il y a un loup
Hypothèse nulle (H0) : il n’y a pas de loup
- Erreur de type I (α) : on rejette à tort l’hypothèse nulle, qu’il n’y a pas de loup (c’est-à-dire, nous croyons qu’il y a un loup), même si l’hypothèse nulle est vraie (il n’y a pas de loup).
- Erreur de type II (β) : nous acceptons incorrectement (ou « ne rejetons pas ») l’hypothèse nulle (il n’y a pas de loup) même si l’hypothèse alternative est vraie (il y a un loup).
Puissance statistique
La puissance d’un test est la probabilité que le test rejette l’hypothèse nulle lorsque l’hypothèse alternative est vraie. En d’autres termes, la probabilité de ne pas commettre d’erreur de type II. En d’autres termes, quelle est la puissance de notre test pour déterminer une différence entre deux populations (H0 et HA) si une telle différence existe ?
- Puissance (1-β) : la probabilité de rejeter correctement l’hypothèse nulle (lorsque l’hypothèse nulle n’est pas vraie).
- Erreur de type II (β) : la probabilité de ne pas rejeter l’hypothèse nulle (lorsque l’hypothèse nulle n’est pas vraie).
Il existe quatre composantes interdépendantes de la puissance :
- B : bêta (β), puisque la puissance est de 1-β
- E : taille de l’effet, la différence entre les moyennes des distributions d’échantillonnage de H0 et HAlt. Plus la différence entre ces deux moyennes est grande, plus votre test aura de puissance pour détecter une différence. Cela s’écrit mathématiquement comme une différence normalisée (d) entre les moyennes des deux populations. d = (μ1-μ0)/σ.
- A : alpha (α), la valeur de signification qui est généralement fixée à 0,05, c’est le seuil auquel nous acceptons ou rejetons notre hypothèse nulle. En rendant α plus petit (α = 0,1), il est plus difficile de rejeter la H0. Cela rend la puissance plus petite.
- N : taille de l’échantillon (n). Plus vous rendez la population grande, plus l’erreur standard devient petite (SE = σ/√n). Fondamentalement, cela rend la distribution de l’échantillon plus étroite et donc rend β plus petit.
Il est vraiment utile de les voir graphiquement dans la vidéo. Essayez de dessiner des exemples de chaque comment le changement de chaque composant change la puissance jusqu’à ce que vous l’obteniez et n’hésitez pas à poser des questions (dans les commentaires ou par courriel).
Signification clinique contre signification statistique
La signification clinique est différente de la signification statistique. Une différence entre les moyennes, ou un effet de traitement, peut être statistiquement significative mais pas cliniquement significative. Par exemple, si la taille de l’échantillon est suffisamment grande, de très petites différences peuvent être statistiquement significatives (par exemple, un changement de poids d’une livre, 1 mmHg de pression artérielle) même si elles n’auront aucun impact réel sur les résultats du patient. Il est donc important de prêter attention à la signification clinique ainsi qu’à la signification statistique lors de l’évaluation des résultats d’une étude. La signification clinique est déterminée en utilisant le jugement clinique ainsi que les résultats d’autres études qui démontrent l’impact clinique en aval des résultats d’études à plus court terme.
Tester votre compréhension
Avec ce problème réglé sur la puissance.