Les fluctuations d'échantillonnage

Intervalles de pari avec loi binomiale

Jadis, la notion d'intervalle de confiance (ou intervalle de pari) était enseignée dès la classe de seconde. On peut donc penser qu'elle est fondamentale. En fait, elle est très peu présente dans les manuels de statistiques. Elle illustre surtout la problématique des fluctuations d’échantillonnage. Éventuellement, elle peut apparaître au détour d'un exercice de terminale qui traiterait des proportions théoriques trouvées avec la loi binomiale.

Cette page se présente comme une première approche, sans développement théorique ni intervalles autour d'autres paramètres que les proportions.

 

À savoir

La procédure est la suivante. D'abord on établit quelle doit être la proportion d'un caractère sur une population de référence. Elle se situe dans un intervalle à déterminer. Ensuite, on échantillonne et on vérifie si la fréquence observée se situe bien dans l'intervalle. Si oui, l'échantillon est considéré comme représentatif. Dans le cas contraire, on estime qu'il ne l'est pas.

Les problèmes à résoudre sont concrets. Selon les cas, une décision devra être prise en fonction du résultat obtenu, ce qui conduit à énoncer au préalable une règle de décision.

Pour une proportion \(p\) comprise entre 0,2 et 0,8 avec une taille d’échantillon supérieure à 25, on peut admettre que pour \(95\%\) des échantillons aléatoires de taille \(n\) issus d’une même population, la fréquence observée se situe dans l’intervalle suivant :

\[\left[p - \frac{1}{\sqrt{n}}\,; p + \frac{1}{\sqrt{n}} \right]\]

Il s'agit d'une formule simplifiée. Cet intervalle est assez étendu mais lorsque le problème à résoudre est modélisable par une loi binomiale, il peut gagner en précision.

Une simple calculatrice suffit pour déterminer les bornes de l'intervalle.

 

Exemple

Un candidat aux élections municipales d’une petite ville aimerait savoir s’il sera élu mais il n’a pas les moyens de payer les services d'un institut de sondage. Une enquête est menée par ses militants sur le marché. Il apparaît que sur 80 électeurs, 42 déclarent qu’ils voteront pour lui (et 38 pour son concurrent, les indécis n’étant pas comptabilisés). Dommage pour ce candidat, il est battu quelques jours plus tard avec \(49\%\) des suffrages exprimés. Va-t-il traiter ses militants d’incapables ?

A posteriori, on sait que la probabilité de vote favorable est de 0,49. Les militants l'ignoraient mais la variable aléatoire \(X,\) nombre de votants favorables, suivait une loi binomiale \(\mathscr{B} (80\,; 0,49).\)

La règle de décision peut s'énoncer ainsi :

Soit \(f\) la fréquence observée (c'est-à-dire \(\frac{42}{80},\) donc 0,525).

  • - Si \(f\) appartient à l'intervalle de fluctuation, on accepte l'hypothèse selon laquelle l'échantillon était correctement choisi au seuil de \(95\%.\)

  • - Si \(f\) n'appartient pas à l'intervalle de fluctuation, on rejette l'hypothèse selon laquelle l'échantillon était correctement choisi au seuil de \(95\%.\)

L’utilisation des calculatrices TI-82 STATS et TI-83 est détaillée en page loi binomiale à la calculatrice. Complétons ce mode d’emploi par une recherche d’intervalle. C'est la TI-83 Premium CE qui sera mise à contribution.

Nous devons établir une table avec, pour chaque nombre possible de réponses positives (donc 0,1, 2, ... 80), la probabilité théorique d'obtenir au plus ce nombre.

Créons d’abord une liste d’entiers naturels qui se suivent : touche 2nd pour bénéficier de la touche listes. Dans le menu, choisir OP. Choix 5 (suite). En l’occurrence, on entre (x,x,0,80) puis touches STO et 2nd L1. Cette procédure vous évite d'entrer chaque valeur de 0 à 80 dans la première liste de l'éditeur statistique.

À présent, touches 2nd, puis distrib. Choix B :binomFRép, puis entrez les deux paramètres de la loi. Affectez les résultats à une liste L2 (STO puis L2. Entrée).

Les deux opérations successives sont indiquées ci-dessous à gauche. La seconde fenêtre montre juste une vérification dans l'éditeur statistique.

TI83

 éditeur stat

Vous remarquez que les probabilités qui apparaissent sur l'écran de droite sont quasi nulles. Comme le candidat a obtenu près de la moitié des voix, la probabilité est infime de n'avoir aucun vote favorable ou très peu sur un échantillon de 80 électeurs.

Cherchons ensuite les valeurs correspondant aux probabilités cumulées de 0,025 et 0,975.

Nous obtiendrons ainsi les deux bornes de l’intervalle puisqu’en laissant 0,025 de chaque côté de la distribution, l’intervalle comprendra bien \(95\%\) de celle-ci. Deux techniques : soit faire défiler L2 dans l’éditeur statistique (option un peu longue mais facile), soit utiliser la fonction SOMME. Le défilement donne ceci :

défilement 1

 défilement 2

Mais pour la beauté du geste, vérifions-le avec la fonction SOMME.

Quittez l'éditeur statistique puis appelez le menu des listes (2nd STAT) et choisir MATH. La somme correspond au choix 5. Demandez que L2 soit inférieur ou égal à 0,025. Le symbole \(\leqslant\) se trouve dans le menu test (2nd MATH) en choix 6. Procédez de la même manière pour 0,025 et 0,975.

intervalle à la TI83

Ceci signifie qu’il y a 95 chances sur 100 pour que le nombre de votes favorables sur un échantillon de 80 électeurs se situe entre 30 et 48. Les militants en avaient trouvé 42.

Prise de décision : le candidat malheureux ne traitera pas ses militants d’incapables, d’abord parce qu’il est reconnaissant de leur dévouement et ensuite parce que ce nombre de 42 est parfaitement compatible avec l’intervalle de fluctuation au seuil de \(5\%.\) De toute façon, il était bien trop hasardeux de se limiter à un échantillon de 80 électeurs seulement pour une problématique d'élection.

Le résultat est proche de ce que nous aurions trouvé avec la formule de seconde, soit \([30\,; 49].\)

Afin de satisfaire votre légitime curiosité, voici à quoi ressemble la distribution de la loi \(\mathscr{B}(80\,; 0,49)\) avec intervalle de fluctuation à \(95\%\) (réalisation avec Excel) :

loi binomiale et intervalle de fluctuation

Voir aussi l'exercice sur la loi binomiale, partie 2.

 

intervalle trop petit