Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

Le test des signes

logo

 

 

 

 

 

 

 

 

 

 

Test non paramétrique du signe

Ce test non paramétrique permet de comparer deux échantillons appariés de mesures ordinales. C’est un concurrent du test des rangs signés de Wilcoxon mais qui ne tient pas compte de l’amplitude des écarts entre les mesures.

Cet exploit est bien joli mais en quelles circonstances est-on amené à conduire une telle entreprise ?

Intérêt de l’utilisation

On mesure quelque chose sur un échantillon puis, plus tard, on mesure la même chose sur ce même échantillon. On ne s’intéresse pas aux mesures proprement dites mais aux classements des observations. Doit-on considérer les deux distributions comme identiques ?

Et d’abord, pourquoi un classement ? Parce que d’une part les données peuvent se trouver sous cette forme (des consommateurs classent des produits sur une échelle de Likert), d’autre part l’échantillon peut être trop petit pour qu’on se risque à un test paramétrique sur les valeurs et on préfère observer des rangs, plus robustes. Enfin, des outliers peuvent ôter toute valeur à un test de moyennes sur échantillons appariés.

On cherche donc généralement à tester une action sur un échantillon. Mais on peut vouloir tester le système de mesure lui-même.

Comme un test de moyennes, le test des signes peut être bilatéral ou unilatéral selon la problématique. Dans l’exemple que je prendrai plus bas, un test bilatéral permettra de savoir si une distribution a été modifiée. Mais le test aurait été unilatéral pour juger d’un effet ne pouvant être a priori que positif ou nul : évaluation d’une formation ou d’une campagne marketing, par exemple…

Le principe

Les deux classements sont comparés et chaque observation est affectée d’un signe (+ en cas d’élévation dans le classement, en cas de descente). Celles qui restent au même niveau sont éliminées.

Selon l’hypothèse H0 à tester, il y a autant de + que de , c’est-à-dire que la médiane de la distribution n’a pas bougé.

Un exemple

Prenons 15 jeunes diplômés recrutés par une entreprise. Les augmentations salariales qu’ils perçoivent au cours de la première année sont relativement homogènes et liées à leurs diplômes. Puis on regarde les augmentations perçues l’année suivante. Constatons-nous une différence ?

exemple

Si l’on s’en tient à un simple test de moyenne, on ne rejette pas H0 et on admet qu’il n’y a pas de différence significative (voir ci-dessous un état de XLSTAT). Toutefois, les augmentations moyennes ne sont pas forcément très parlantes, à l’instar des rémunérations moyennes. On utilise plutôt les médianes.

test de moyennes

Par conséquent, nous allons vérifier si la distribution est la même en recourant au test des signes. Et là, si l’on s’en tient à un seuil de risque de 5 %, il nous faut bien reconnaître que la p-value est inférieure à 5 %. On la rejette donc, sachant qu’on accepte 3,5 % de risque de se tromper…

test des signes

On peut le constater sur le tableau : les trois premiers individus ont bénéficié d'une augmentation supérieure et les douze autres se sont contenté d'une augmentation inférieure. On conclut que l’entreprise s’affranchit rapidement de la « prime au diplôme » pour reconnaître les compétences sur le terrain.

Pour aller un peu plus loin

Nous avons utilisé un test binomial de probabilité 0,5. Dans notre exemple, cette probabilité se vérifie d’ailleurs sur une table de la fonction de répartition d’une loi binomiale pour n = 15 et k = 7 (comme est impair, = (– 1) 2).

Pour k = 3, on trouve dans la table ou sur tableur 0,0176 (=LOI.BINOMIALE(3;15;0,5;VRAI), le « VRAI » signifiant que l’on demande un cumul de 0 à 3).

Cette valeur de 0,0176 aurait été la p-value d’un test unilatéral. Ici, nous sommes sur du bilatéral et la p-value est du double.

Remarquons au passage qu’un simple tableur suffit pour réaliser un test des signes en un temps record.

 

signe

 

© JY Baudot - Droits d'auteur protégés