Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

Le test de Wilcoxon

logo

 

 

 

 

 

 

 

 

 

 

Test signé des rangs de Wilcoxon

Dans le vaste supermarché de tests que les statistiques ont à nous offrir, celui de Wilcoxon devrait être l’un des plus utilisés en entreprise. Et pourtant, ce grand modeste n’est pas aussi connu qu’il le mériterait…

En effet, il s’agit d’un test de rangs sur échantillons APPARIÉS, c’est-à-dire qu’il peut être utilisé chaque fois que des répondants à une enquête donnent leur avis sur une échelle (du type : note de 1 à 5), avant d’être réinterrogés après un évènement. Celui-ci peut concerner les ressources humaines (évaluation d’une formation, évaluation d’un ressenti par un audit social) mais surtout le marketing (évaluation auprès d’un panel d’une nouvelle image de marque, par exemple). Non paramétrique, il s'accommode de distributions asymétriques ou de variances différentes entre la première enquête et la seconde.

Un autre test concurrence celui de Wilcoxon et c’est celui des signes. L’avantage de celui de Wilcoxon est de prendre en considération les différences d'écarts entre observations : une évolution entre « bon » et « très bon » n’est pas considérée comme identique à une évolution entre « très mauvais » et « très bon ». Donc, malgré une mise en œuvre un peu moins pratique, on opte souvent pour ce test-là.

Pour ce faire, on utilise des écarts entre modalités de réponse (qu’on suppose donc équidistantes). Sur une échelle de 1 à 7, les distances varient donc entre -6 et +6. Les nulles sont éliminées de l’effectif.

Puis on classe par ordre croissant les VALEURS ABSOLUES des distances, ce qui permet de leur affecter un RANG. On additionne ensuite les numéros de rangs des différences positives. À partir du tableau déjà trié ci-dessous, on obtiendrait W+ = 1 + 4 = 5. On en déduit par la même occasion la somme des « rangs signés » W-.

principe

Un mot sur les ex-æquo, qu’il est naturel d’obtenir du moment que l’effectif n’est pas ridiculement faible. On leur affecte alors une moyenne de rang. Illustration :

ex-aequo

Sous l’hypothèse H0 que l’on teste, ces différences suivent une loi de probabilité symétrique, c’est-à-dire W+ = W-. La somme des rangs est forcément égale à n(+ 1) 2 (somme d’une suite arithmétique de raison 1) donc, sous H0, W+ = W- = n(+ 1) 4. C’est l’espérance mathématique de chacune des deux distributions.

Si l’effectif est suffisamment grand, on peut supposer que W suit une loi normale dont l’espérance est celle indiquée ci-dessus et la variance est égale à n(n + 1)(2n + 1) 24 (mais l’écart-type est relooké pour corriger le traitement des ex-æquo).

Bref, c’est ici que l’exemple entre en scène et je vous renvoie à la littérature pour davantage d’informations sur la théorie (les ouvrages francophones sont toutefois rarissimes).

Voici des notes sur 10, attribuées par un échantillon de 23 consommateurs à un ancien et à un nouveau packaging. L'opinion de douze d’entre eux a évolué.

exemple

Pour onze personnes, la différence n’est que de 1. Aussi sont-elles toutes affectées du rang 6 (Cf. ci-dessus le traitement des ex-æquo). Pour une douzième personne, la différence est de 2. Cette dernière est donc affectée du rang 12. C’est ainsi qu’on établit un W+ égal à 60 et un W- égal à 18, comme vous pouvez le vérifier si le cœur vous en dit.

Sur Tanagra, la statistique obtenue est de 1,807 et la p-value est de 0,07 pour un test bilatéral (entrer « avant » en input et « après » en target, puis Wilcoxon Signed Ranks Test).

tanagra.png

Pour contrôle, le tableau de SPSS :

etat SPSS

Enfin, Statbox présente une statistique très légèrement différente. Seuil et p-value doivent être multipliés par 2 pour être comparables aux états précédents.

statbox

De justesse, on ne rejette pas H0, considérant que les notes sont les mêmes avant et après en acceptant un seuil de risque de 5 %.

 

évolutions nulles

 

© JY Baudot - Droits d'auteur protégés