Test de fréquence de McNemar sur échantillons appariés

Test de fréquence sur deux échantillons appariés

La problématique de ce test non paramétrique serait celle d’un test de fréquence sur deux échantillons appariés. Tout un programme. Prenons l’exemple d’un panel de consommateurs, avant et après une action de marketing. Ces braves gens répondent à une question binaire (oui ou non, j’achète ou pas, satisfait ou insatisfait…). Intéressons-nous aux consommateurs qui ont changé d’avis entre les deux enquêtes.

population

Procédure

Pour cela, il faut comparer l’effectif qui est passé de « oui » à « non » à celui qui est passé de « non » à « oui ». L’hypothèse nulle, que l’on va tester, est que ces deux sous-populations se compensent peu ou prou.

Il suffit donc d’un tableau de contingence à quatre cases pour procéder au test, sauf si votre logiciel réclame des données brutes...

La théorie : on mesure l’écart entre les consommateurs versatiles du premier type à ceux du second type avec la distance du khi². Dans le tableau ci-dessous, on compare les cases \(B\) et \(C.\)

ABCD

La distance est égale à \(\frac{(B - C)^2}{B + C}\)et sous H0, elle suit une loi du khi² à un degré de liberté. Il existe une variante à cette distance, corrigée par Yates : \(\frac{(|B - C| - 1)^2}{ B + C}.\)

Il est tout à fait possible d’utiliser un tableur pour réaliser ce test, en utilisant les fonctions KHIDEUX.INVERSE et LOI.KHIDEUX (voir « Statistiques avec Excel » de J.-P. Georgin et M. Gouet, PUR 2005 chapitre 11).

Toutefois, nous utiliserons d’autres logiciels sur l'exemple qui suit.

Exemple

Lors d’un audit social, un consultant interroge 200 salariés sur l’organisation du travail. La question est fermée : satisfait ou non. Trois mois après quelques réaménagements, la même question est posée. Peut-on considérer que les salariés perçoivent un réel changement ?

réponses

En regardant le tableau, on peut préciser le sens du changement et reformuler la question : les choses ont-elles empiré ?

Utilisons XLSTAT directement sur le tableau de contingence, bien que le logiciel permette aussi une analyse sur les données brutes. On se fixe un seuil d’erreur de \(5\%\) :

McNemar exact

La p-value est supérieure au seuil de \(5\%.\) On ne rejette pas H0, estimant que la situation n’a pas empiré.

Les conclusions sont les mêmes si l’on prend en considération la correction de Yates (sur XLSTAT, cocher l’option correction de continuité).

version asymptotique

Si vous souhaitez faire un test gratuitement sur le web, vous pouvez entrer votre tableau de contingence sur cette page (université de Jussieu) :

http://www.u707.jussieu.fr/biostatgv/nemar.php

Vous obtenez ce résultat :

Jussieu

Il s’agit apparemment de la version corrigée de Yates.

Pour terminer, voyons ce que nous donne SPSS. Sur la grille, on n’entre pas le tableau de contingence mais les données brutes. Les résultats sont les suivants :

SPSS

On constate que SPSS nous donne cette même version corrigée de la p-value de McNemar.

Pour terminer, sachez qu'un test assez proche de celui-ci permet cette même étude mais sur trois échantillons appariés ou plus. Il s'agit du test de Cochran.

duel