Une exemple de test de Wilcoxon

Test signé des rangs de Wilcoxon avec logiciels

Rappelons le contexte. Nous sommes en présence de deux échantillons appariés, c'est-à-dire composé des mêmes individus mais, souvent, observés à deux dates différentes. Des données numériques ont été collectées, peut-être des données ordinales. Les échantillons ne sont pas forcément très grands et il est difficile de leur attribuer une loi de probabilité. Nous nous tournons alors vers un test non paramétrique, celui de Wilcoxon sur les rangs signés (c'est-à-dire affectés du signe positif ou négatif) qui nous permettra de valider ou non l'hypothèse selon laquelle les échantillons sont identiques ou non.

Examinons un exemple.

Données

Voici des notes sur 10, attribuées par un échantillon de 23 consommateurs à un ancien puis à un nouveau packaging. L'opinion de douze d’entre eux diffère.

avant après
2 3
3 3
3 4
4 4
4 5
5 5
6 5
6 6
6 6
6 7
6 8
7 6
7 7
7 8
8 7
8 8
8 8
8 9
9 9
9 9
9 10
9 10
10 10

Pour onze personnes, la différence n’est que de 1. Aussi sont-elles toutes affectées du rang 6. Pour une douzième personne, la différence est de 2. Cette dernière est donc affectée du rang 12 (vous pouvez superbement ignorer cette étape si vous utilisez un logiciel).

C’est ainsi que l’on établit une somme des rangs positifs W+ égale à 60 et une statistique W- égale à 18, comme vous pouvez le vérifier si le cœur vous en dit.

Logiciels

Sur Tanagra, la statistique W obtenue est de 1,807 et la p-value est de 0,0707 pour un test bilatéral (entrer « avant » en input et « après » en target, puis Wilcoxon Signed Ranks Test).

tanagra.png

On ne peut pas rejeter l'hypothèse H0 puisque la p-value calculée est supérieure (de peu !) à 0,05. Le risque de rejeter H0 alors qu'elle est vraie est de 7,07 %.

Notez que l'échantillon étant suffisamment grand, il est possible d'utiliser la loi normale. Donc, en l'absence de logiciel, vous pouvez retrouver cette valeur de 0,0707 avec une table, une calculatrice ou un tableur.

Pour contrôle, le tableau de SPSS :

etat SPSS

Statbox présente une statistique très légèrement différente. Seuil et p-value doivent être multipliés par 2 pour être comparables aux états précédents.

statbox

Enfin, les données ont été moulinées par XLSTAT...

xlstat Wilcoxon

Pour information, le test du signe, moins précis, donne une p-value plus élevée.