Test d'adéquation du khi-deux
Un grand classique. Un must have des manuels de statistiques. C’est le test d’ajustement le plus célèbre car le plus souvent enseigné, malgré ses limites. Il a été mis au point par l'Anglais Karl Pearson en 1900.
Sa mission consiste à évaluer si une distribution observée peut être estimée ou non par une loi de probabilité. Il vérifie donc un ajustement, une adéquation (goodness of fit).
Méthode
Le principe est le suivant : on mesure des distances entre chaque valeur observée et une valeur théorique, on en fait la somme puis on mesure le montant de cette somme à l’aune d’une norme acceptable pour répondre à la question « notre modélisation est-elle valable ? » Présenté ainsi, ce principe peut aussi s’appliquer à une régression linéaire simple ou multiple…
Il existe tout de même des différences, à commencer par la métrique puisqu’on utilise ici la distance du khi², c’est-à-dire (\(O\) étant un effectif observé et \(T\) un effectif théorique) :
\[d^2 = \sum\limits_{x = 1}^n {\frac{(O_i - T_i)^2}{T_i}}\]
D’autres tests unilatéraux d’ajustement utilisent d’autres distances. Un test du \(\chi ^2\) est fréquemment accompagné d’un test de Kolmogorov-Smirnov, deux précautions valant mieux qu’une…
Contrairement au test du \(\chi ^2\) d’indépendance, celui d’adéquation ne compare que des distributions selon un seul critère. Les tableaux de contingence sont ici hors sujet. Mais un test d’indépendance sur un seul critère peut être considéré comme un test d’ajustement à une loi uniforme.
Sous l’hypothèse H0, l’ajustement à la loi théorique est bon. La distance observée doit être comparée à la valeur que prend la loi du \(\chi ^2\) pour [\(n - 1 -\) nombre de paramètres estimés de la loi théorique)] degrés de liberté. Évidemment, la conclusion du test dépend aussi de la marge d’erreur que l’on s’est donnée.
Un ajustement ne s’effectue pas uniquement par rapport à une loi théorique mais aussi au regard d’autres observations, notamment pour vérifier si un échantillon reflète bien, sur un critère qualitatif particulier, les statistiques établies au niveau de la population globale. Cf. notamment l’illustration donnée par E. Vernette (Techniques d’études de marché, Vuibert 2006, p. 70) qui montre comment un test du \(\chi ^2\) permet de supposer qu’un enquêteur bidonne ses interviews !
Une classe d’effectif théorique doit comprendre au moins cinq valeurs. Dans le cas contraire, on regroupe la classe sous-représentée avec la suivante ou la précédente.
Les problématiques diffèrent toujours mais d’une façon générale, on souhaite pouvoir ajuster les observations à une loi, au contraire du test d’indépendance où l’on espère bien détecter une liaison.
Exemple
Dans le cadre d’une étude de marché, on relève une série de notes attribuées par 30 répondants à un message publicitaire. Peut-on estimer que ces notes suivent une loi normale ? Le test du \(\chi ^2\) peut-il être confirmé par d’autres tests ?
Pour répondre à ces questions, entrons ces valeurs dans Statgraphics Centurion. Menu « décrire », puis « lois » puis « ajustements de lois (données non censurées) ». Nous n’obtenons pas directement le résultat souhaité mais un clic droit sur la fenêtre du test de Shapiro-Wilks permet d'ajouter des options, notamment le test du \(\chi ^2.\)
Nous ne rejetons pas l’hypothèse selon laquelle la distribution observée suit une loi normale (d’espérance 25,43 et d’écart-type 11,32). Néanmoins, on devine sur le graphique ci-dessous qu’une loi triangulaire serait davantage adaptée.
L’analyse réalisée par XLSTAT est assez différente. Certes, les paramètres estimés de la loi normale sont les mêmes mais par défaut les notes sont partagées en 10 classes, contre 15 par Statgraphics. Compte tenu des regroupements de classes d’effectifs théoriques, le nombre de degrés de liberté est de 7. En revanche, Statgraphics donne peu d’informations et, au vu des résultats, il semble bien que le nombre de degrés de liberté soit de 12, c’est-à-dire qu’aucun regroupement de classe n’est effectué…
On conclut que l’échantillon suit très probablement une loi normale. Les détails sont fournis par le logiciel :
Avec les versions utilisées (2009), il semble donc que XLSTAT soit plus fiable que Statgraphics sur les tests du \(\chi ^2.\)
Voir aussi la page d'étude des temps d'arrivée (adéquation à une loi exponentielle dans le champ d'un processus de Poisson).