Statistique \(Q\) de Cochran
La quantité d’outils dont disposent les statisticiens est impressionnante. Rien que dans la gamme des tests, il en existe plusieurs dizaines. Plus ou moins connus, plus ou moins performants, et surtout plus ou moins généraux ou spécifiques.
Applications
Le test de Cochran a des applications très particulières. Il vérifie si plusieurs échantillons appariés présentent les mêmes configurations de probabilités de succès ou d’échec.
Comme c’est un test non paramétrique, il peut s’appliquer à des échantillons qui ne présentent pas de distribution normale ou qui sont relativement petits.
Le principe
L’hypothèse nulle (H0) qu’on cherche à valider (ou à invalider) est celle de l’égalité des \(k\) distributions. L’hypothèse alternative est qu’un échantillon au moins présente une différence.
Ce test montre un certain air de famille avec celui de McNemar. Ce dernier est utilisé pour deux échantillons appariés seulement.
Les données se présentent sous la forme d’un tableau constitué de 0 et de 1. Les différents échantillons figurent en colonne et les unités statistiques en ligne. Les distributions marginales (totaux du tableau) fournissent donc le nombre de succès par échantillon et par unité (ou individu).
La statistique \(Q\) se présente comme le rapport de la variance des \(k\) échantillons sur la variance des individus. Sous l’hypothèse H0 et selon des sources bien informées, cette statistique suit une loi du khi² à \(k - 1\) degrés de liberté. C’est donc un test d’homogénéité des variances.
Exemple
La société Quipic commercialise des cactus d’ornement. Par le biais d’une amicale d’amateurs, elle a constitué un panel informel de 16 cactophiles. Pendant cinq ans, il est demandé à ces derniers si les pilosocereus qu’ils ont achetés en 2006 leur donne entière satisfaction. Le but n’est pas seulement de collecter une opinion cinq ans plus tard ; si l’avis global est le même en début et fin de période mais qu’il diffère entre-temps, ceci doit apparaître dans l’étude. C’est pourquoi on procède à un test de Cochran et non à un test de McNemar.
XLSTAT nous fournit les résultats suivants :
Au seuil de \(5\%,\) la valeur observée de \(Q\) est bien inférieure à sa valeur critique. On ne peut donc pas rejeter l’hypothèse selon laquelle toutes les années présentent la même distribution.
Compléments à cet exemple
Sortie de Tanagra :
Sortie de SPSS :
Sortie de Statistica :
Calcul de \(Q\) avec Excel. (\(L\) est le nombre de lignes et \(C\) celui des colonnes) :
\[Q = \frac{\left(k - 1\right) \left[k \sum\limits_{j = 1}^k C_j^2 - \left(\sum\limits_{j = 1}^k C_j \right)^2 \right]}{k \sum\limits_{i = 1}^n L_i - \sum\limits_{i = 1}^n L_i^2}\]
\[Q = \frac{4(5 \times 722 - 60^2)}{5 \times 60 - 250} = 0,8\]