J’ai regardé l’autre soir un vieux film de moto des années 1960, et j’ai été frappé par l’argot des motards. Ils avaient un langage qui leur était propre. Tout comme les statisticiens, dont la façon de parler déroute souvent ceux qui ne connaissent pas le jargon de l’analyse des données.
Ça m’a fait penser… et s’il y avait un gang de motards entièrement composé de statisticiens ? Appelez-les les Nulls Angels. Imaginez-les dans leurs couleurs, déchirant la campagne, analysant des données et demandant aux gens qu’ils rencontrent sur la route s’ils « échouent à rejeter l’hypothèse nulle ».
Si vous faites remarquer à quel point cette phrase semble étrange, les Nulls Angels sauront que vous n’êtes pas cool… et pas très au fait des statistiques.
Parlant purement en tant que rédacteur, je reconnais que « échouer à rejeter l’hypothèse nulle » fait froid dans le dos. « Failing to reject » semble être un équivalent trop compliqué à accepter. Au minimum, c’est une formulation maladroite.
Mais il s’avère que ces statisticiens bruts et prêts à l’emploi dans les Nulls Angels ont de bonnes raisons de parler ainsi. D’un point de vue statistique, c’est indéniablement précis – et remplacer « échec à rejeter » par « accepter » serait tout simplement faux.
Qu’est-ce que l’hypothèse nulle, d’ailleurs ?
Les tests d’hypothèse comprennent les tests t à un et deux échantillons, les tests d’association, les tests de normalité, et bien d’autres encore. (Tous ces tests sont disponibles dans le menu Stat du logiciel statistique Minitab. Ou, si vous voulez un peu plus de conseils statistiques, l’assistant peut vous guider pas à pas à travers les tests d’hypothèse courants.)
Un test d’hypothèse examine deux propositions : l’hypothèse nulle (ou H0 pour faire court), et l’alternative (H1). L’hypothèse alternative est ce que nous espérons soutenir. Nous présumons que l’hypothèse nulle est vraie, sauf si les données fournissent des preuves suffisantes qu’elle ne l’est pas.
Vous avez entendu l’expression « Innocent jusqu’à preuve du contraire ». Cela signifie que l’innocence du défendeur est considérée comme acquise jusqu’à ce que la culpabilité soit prouvée. En statistique, l’hypothèse nulle est considérée comme acquise jusqu’à ce que l’alternative soit prouvée vraie.
Alors, pourquoi « échouons-nous à rejeter » l’hypothèse nulle ?
Cela soulève la question de la « preuve ».
Le degré de preuve statistique dont nous avons besoin pour « prouver » l’hypothèse alternative est le niveau de confiance. Le niveau de confiance est égal à 1 moins notre risque de commettre une erreur de type I, qui se produit lorsque vous rejetez à tort une hypothèse nulle qui est vraie. Les statisticiens appellent ce risque alpha, et y font également référence en tant que niveau de signification. L’alpha typique de 0,05 correspond à un niveau de confiance de 95 % : nous acceptons une chance de 5 % de rejeter l’hypothèse nulle même si elle est vraie. (Dans les questions de vie ou de mort, nous pourrions abaisser le risque d’erreur de type I à 1 % ou moins.)
Quel que soit le niveau alpha que nous choisissons, tout test d’hypothèse n’a que deux résultats possibles :
- Rejeter l’hypothèse nulle et conclure que l’hypothèse alternative est vraie au niveau de confiance de 95% (ou au niveau que vous avez choisi).
- Ne pas rejeter l’hypothèse nulle et conclure qu’il n’y a pas suffisamment de preuves pour suggérer que l’hypothèse nulle est fausse au niveau de confiance de 95%.
Nous utilisons souvent une valeur p pour décider si les données soutiennent l’hypothèse nulle ou non. Si la valeur p du test est inférieure au niveau alpha que nous avons choisi, nous rejetons l’hypothèse nulle. Ou, comme le disent les statisticiens : « Lorsque la valeur p est faible, l’hypothèse nulle doit être rejetée. »
Cela n’explique toujours pas pourquoi un statisticien n’accepte pas « l’hypothèse nulle ». Voici l’essentiel : ne pas rejeter l’hypothèse nulle ne prouve pas que l’hypothèse nulle est vraie. C’est parce qu’un test d’hypothèse ne détermine pas quelle hypothèse est vraie, ou même laquelle est la plus probable : il évalue seulement si des preuves existent pour rejeter l’hypothèse nulle.
« Nul jusqu’à preuve du contraire »
Rappelons « innocent jusqu’à preuve du contraire ». En tant qu’analyste de données, vous êtes le juge. Le test d’hypothèse est le procès, et l’hypothèse nulle est le défendeur. L’hypothèse alternative est l’accusation, qui doit faire valoir ses arguments au-delà de tout doute raisonnable (disons, avec 95 % de certitude).
Si les preuves du procès ne montrent pas que le défendeur est coupable, elles ne prouvent pas non plus qu’il est innocent. Cependant, sur la base des preuves disponibles, vous ne pouvez pas rejeter cette possibilité. Alors comment annonceriez-vous votre verdict ?
« Non coupable ».
Cette phrase est parfaite : « Non coupable » ne dit pas que le défendeur est innocent, car cela n’a pas été prouvé. Elle dit simplement que l’accusation n’a pas pu convaincre le juge d’abandonner la présomption d’innocence.
Donc « l’échec du rejet de la nullité » est l’équivalent statistique de « non coupable ». Dans un procès, la charge de la preuve incombe à l’accusation. Lors de l’analyse des données, toute la charge de la preuve incombe à votre échantillon de données. « Non coupable » ne signifie pas « innocent », et « ne pas rejeter » l’hypothèse nulle est tout à fait distinct de « l’accepter ».
Alors, si un groupe de statisticiens en maraude dans leurs cuirs Nulls Angels vous le demande un jour, gardez-vous dans leurs bonnes grâces, et montrez que vous savez que « ne pas rejeter l’hypothèse nulle » n’est pas « accepter l’hypothèse nulle ».