Test de Wilcoxon-Mann-Whitney
Ce test non paramétrique est bienvenu pour comparer deux échantillons indépendants de petite taille. Nous verrons qu’il utilise les RANGS, c’est-à-dire l’ordre dans lequel apparaissent les observations des deux échantillons réunis. Par conséquent, il est valide sur des données cardinales ou ordinales, voire sur des variables différentes selon les échantillons. Il teste l’hypothèse H0 selon laquelle les échantillons sont identiquement positionnés. Il est quelquefois appelé « test de Wilcoxon ». Mais ne le confondez pas pour autant avec le test signé des rangs de Wilcoxon… La taille minimale de chaque échantillon est de 4 à 8 observations selon les auteurs. En tout cas moins que le test concurrent de Kolmogorov-Smirnov et a fortiori que les tests paramétriques. Un autre test parfois concurrent est le test de la médiane. Pour expliquer le principe du test sur une variable ordinale, je « matérialiserai » celle-ci par des cartes. Imaginez deux paquets issus d’un jeu de 54 cartes, par exemple les piques et les trèfles triés de l’as jusqu’au dix. Mélangez-les en seul geste de façon à respecter l’ordre de chaque paquet. Ce test vous dira si votre mélange a été homogène ou non. Comment ? En affectant un numéro de 1 à 20 à l’ordre d’apparition dans le nouveau paquet puis en observant les 10² = 100 paires possibles. Dès lors, on ne s’occupe plus de la valeur de la carte mais seulement de sa couleur et de son nouveau numéro. Pour combien de paires le numéro du trèfle est-il supérieur à celui du pique (ou inversement) ? La statistique de Mann-Whitney, sobrement notée U, est ce nombre. Dans notre exemple, elle est située entre 0 et 100 et son espérance est de 50. Sa variance s’établit à [100(20 + 1)] / 12 = 175. Selon qu’on compare les trèfles aux piques ou inversement, on obtiendra un nombre inférieur ou supérieur à 50. Cela n’a pas d’importance puisqu’il y a symétrie. Certains auteurs ou logiciels choisissent le plus petit, d’autres s’attachent à l’ordre dans lequel les séries sont observées (auquel cas soyez vigilants si votre test est unilatéral). Ce fameux U suit une loi normale. Donc, ayant toutes les informations pour le centrer et le réduire, on peut déterminer s’il peut être considéré comme suivant une loi de Gauss d’espérance nulle et d’écart-type égal à 1. On peut aussi utiliser directement les tables de Mann-Whitney si on les trouve… D’autant que U ne suit une loi normale qu’à condition d’avoir des échantillons d’au moins 8 observations. Elles indiquent la valeur limite de U en fonction des effectifs de chacun des échantillons (il existe une table par niveau de confiance). Comme on l’imagine, plus U s’éloigne de l’espérance, plus les deux échantillons présentent la chance (ou le risque, c’est selon) d’être différemment positionnés. C’est l’écart positif entre U et l’espérance qu’on compare avec les valeurs indiquées par les tables de Mann-Whitney. NB : dans le cas de variables ordinales, les ex-æquo sont affectés d’un rang avec décimales. Supposons qu’il manque le 8 de trèfle mais qu’il y a deux 7, ces cartes prendront toutes deux la valeur 7,5. Exemple (avec variable numérique) Soit une compagnie aérienne dont la flotte est constituée de 8 appareils A (rouges) et de 11 appareils B (bleus). Sur une période donnée, le nombre d’incidents relevés sur chaque avion est utilisé pour savoir s’il existe une différence significative de fiabilité entre les deux types d’appareils.
Ce qui va nous intéresser est la colonne « rang » du tableau ci-dessous et uniquement celle-ci (je ne présente ce deuxième tableau qu’à des fins pédagogiques ; il est évident que c’est à partir des chiffres ci-dessus que l’analyse est effectuée).
J’utilise ici le logiciel XLSTAT. Un test bilatéral est réalisé à un niveau de signification de 5 %. Voici les résultats :
On ne prend pas le risque de refuser H0. Rappelons que dans le cas extrême où les deux échantillons ne seraient pas du tout mélangés, U serait égal à 0 ou à 88. Ici, 33,5 est suffisamment proche de l’espérance de 44. On peut donc estimer qu’il n’existe pas de différence de fiabilité entre les deux types d’avions. NB : ce test s'enorgueillit d'une variante utilisant la statistique de Wilcoxon Wx, somme des rangs, qui n’est pas abordée ici.
|






