Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

La comparaison de moyennes (2 échantillons appariés)

logo

 

 

 

 

 

 

 

 

 

 

Test de comparaison de 2 moyennes (échantillons appariés)

Supposons. Vous êtes l’heureux observateur d’un échantillon dont vous relevez une moyenne. Illustrons ce propos par une flotte de véhicules dont vous constatez la consommation moyenne aux 100 km ou par un panel de consommateurs dont vous relevez la quantité mensuelle de dentifrice utilisée. Un an plus tard, vous mesurez à nouveau la consommation moyenne de votre panel et là, damned ! les chiffres sont différents…  Cet écart est-il significatif et faut-il étudier le pourquoi du comment ou peut-on considérer qu’il ne provient que d’un petit aléa, voire d’une erreur de mesure ?

Les études d’échantillons appariés présentent souvent plus d’intérêt que les études sur échantillons indépendants. L’influence de facteurs exogènes est réduite et les résultats sont bien plus précis, donc plus opérationnels. L’hypothèse d’égalité des variances (test F) est inutile.

Exemple

Nous prévoyons une évolution des ventes de treize variétés de fromages. On relève la moyenne des différences pour la rapporter à son indicateur de dispersion (écart-type sans biais divisé par la racine carrée de l’effectif). La statistique obtenue suit une loi de Student à – 1 degrés de liberté.

Il s’agit d’un test de comparaison mais on peut le considérer comme un test de conformité à une norme puisqu’on compare une différence de moyennes à zéro, c’est-à-dire à un nombre.

En acceptant un taux d’erreur de 5 %, les deux moyennes du tableau ci-dessous sont-elles différentes ?

Fromages

On pose le test.

Hypothèse nulle (H0) : il n’y a pas d’évolution. H1 : il y a évolution.

On utilise ici XLSTAT, menu « tests paramétriques » puis « Tests t et Z pour 2 échantillons » (cochez « appariés »). Le résultat suivant apparaît (extrait) :

Xlstat échantillons appariés

Décision : on rejette l’hypothèse H0. Pour le taux d’erreur qu’on s’est fixé, on considère qu’il y a évolution entre les ventes de lundi et les prévisions pour mardi.

Remarque : comme je l’ai précisé, nous avons construit un test à partir de la moyenne des différences. Si par exemple on échange deux valeurs pour mardi (mimolette à 55 et comté à 24), le résultat sera bien sûr différent alors que si les échantillons étaient indépendants, ceci n’aurait aucune importance.

Maintenant, un peu de curiosité.

Supposons que nos deux échantillons soient indépendants (remplacez lundi et mardi par fromagerie d’Evry et fromagerie de Versailles). XLSTAT nous restitue ceci :

Résultats Xlstat

Avec deux fois plus de degrés de liberté, la p-value est largement au-dessus de 0,05. La valeur observée est inférieure à la valeur critique. Le test est beaucoup moins sévère. On considère maintenant  que les deux moyennes sont identiques !

 

poids moyen

 

© JY Baudot - Droits d'auteur protégés