Le test des signes

Test non paramétrique du signe

Ce test non paramétrique permet de comparer deux échantillons appariés de mesures ordinales. C’est un concurrent du test des rangs signés de Wilcoxon mais qui ne tient pas compte de l’amplitude des écarts entre les mesures.

Cet exploit est bien joli mais en quelles circonstances est-on amené à conduire une telle entreprise ?

 

Intérêt de l’utilisation

On mesure quelque chose sur un échantillon puis, plus tard, on mesure la même chose sur ce même échantillon. On ne s’intéresse pas aux mesures proprement dites mais aux classements des observations. Doit-on considérer les deux distributions comme identiques ?

Et d’abord, pourquoi un classement ? Parce que d’une part les données peuvent se trouver sous cette forme (des consommateurs classent des produits sur une échelle de Likert), d’autre part l’échantillon peut être trop petit pour qu’on se risque à un test paramétrique sur les valeurs et on préfère observer des rangs, plus robustes. Enfin, des outliers peuvent ôter toute valeur à un test de moyennes sur échantillons appariés.

On cherche donc généralement à tester une action sur un échantillon. Mais on peut vouloir tester le système de mesure lui-même.

Comme un test de moyennes, le test des signes peut être bilatéral ou unilatéral selon la problématique. Dans l’exemple que nous prendrons plus bas, un test bilatéral permettra de savoir si une distribution a été modifiée. Mais le test aurait été unilatéral pour juger d’un effet ne pouvant être a priori que positif ou nul : évaluation d’une formation ou d’une campagne marketing, par exemple…

 

Le principe

Les deux classements sont comparés et chaque observation est affectée d’un signe (+ en cas d’élévation dans le classement, – en cas de descente). Celles qui restent au même niveau sont éliminées.

Selon l’hypothèse H0 à tester, il y a autant de + que de –, c’est-à-dire que la médiane de la distribution n’a pas bougé.

++

 

Un exemple

Prenons 15 jeunes diplômés recrutés par une entreprise. Les augmentations salariales qu’ils perçoivent au cours de la première année sont relativement homogènes et liées à leurs diplômes. Puis on regarde les augmentations perçues l’année suivante. Constatons-nous une différence ?

  année 1 année 2
Bob 250 800
Gus 250 900
Ali 360 650
Léo 300 220
Joe 210 150
Luc 250 120
Lou 200 110
Léa 210 190
Jim 260 210
Ida 220 140
Guy 250 150
Zoé 300 150
Roy 200 90
Eva 240 120
Tom 210 100
Moyenne 247,3 273,3

Si l’on s’en tient à un simple test de moyenne, on ne rejette pas H0 et on admet qu’il n’y a pas de différence significative (voir ci-dessous un état de XLSTAT). Toutefois, les augmentations moyennes ne sont pas toujours très parlantes, à l’instar des rémunérations moyennes. On utilise plutôt les médianes.

test de moyennes

Par conséquent, nous allons vérifier si la distribution est la même en recourant au test des signes. Et là, si l’on s’en tient à un seuil de risque de \(5\%,\) il nous faut bien reconnaître que la p-value est inférieure à \(5\%.\) On la rejette donc, sachant qu’on accepte \(3,5\%\) de risque de se tromper…

test des signes

On peut le constater sur le tableau : les trois premiers individus ont bénéficié d'une augmentation supérieure et les douze autres se sont contenté d'une augmentation inférieure. On conclut que l’entreprise s’affranchit rapidement de la « prime au diplôme » pour reconnaître les compétences sur le terrain.

Un autre exemple, non détaillé, figure en fin de page de test des rangs signés de Wilcoxon avec logiciels.

 

Pour aller un peu plus loin

Nous avons utilisé un test binomial de probabilité 0,5. Dans notre exemple, cette probabilité se vérifie d’ailleurs sur une table de la fonction de répartition d’une loi binomiale pour \(n = 15\) et \(k = 7\) (comme \(n\) est impair, \(k = \frac{n-1}{2}.\)

Pour \(k = 3,\) on trouve soit dans la table soit avec un tableur 0,0176 (=LOI.BINOMIALE(3;15;0,5;VRAI), le « VRAI » signifiant que l’on demande un cumul de 0 à 3).

Cette valeur de 0,0176 aurait été la p-value d’un test unilatéral. Ici, nous sommes sur du bilatéral et la p-value est du double.

Remarquons au passage qu’un tableur suffit pour réaliser un test des signes en un temps record.

 

signe