Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

Les fluctuations d'échantillonnage

logo

 

 

 

 

 

 

 

 

 

 

Intervalles de fluctuation avec loi binomiale

En France, depuis que sont entrés en vigueur les programmes de maths de 2010, les lycéens découvrent la problématique des fluctuations d’échantillonnage. En classe de seconde, ils reçoivent une initiation aux intervalles de fluctuation. En première STMG, première ES et première S, ils les appliquent aux proportions théoriques trouvées avec la loi binomiale.

La procédure est la suivante. D'abord on établit quelle doit être la proportion d'un caractère sur une population de référence. Elle se situe dans un intervalle à déterminer. Ensuite, on échantillonne et on vérifie si la fréquence observée se situe bien dans l'intervalle. Si oui, l'échantillon est considéré comme représentatif. Dans le cas contraire, on estime qu'il ne l'est pas.

Les problèmes à résoudre sont concrets. Selon les cas, une décision devra être prise en fonction du résultat obtenu, ce qui conduit à énoncer au préalable une règle de décision.

En seconde, on apprend que pour une proportion p comprise entre 0,2 et 0,8 avec une taille d’échantillon supérieure à 25, alors on peut admettre que pour 95 % des échantillons aléatoires de taille n issus d’une population, la fréquence observée se situe dans l’intervalle suivant :

intervalle (programme de seconde)

Cet intervalle n'est pas très précis et lorsque le problème à résoudre est modélisable par une loi binomiale, il peut l'être davantage.

En classe de première, aucune formule n’est ajoutée au programme. L'intervalle se détermine à la calculatrice. Mais l'approche est un peu différente dans la mesure où l'on utilise une loi de probabilité.

Exemple

Un candidat aux élections municipales d’une petite ville aimerait savoir s’il sera élu mais il n’a pas les moyens de payer un institut de sondage. Une enquête est menée par ses militants sur le marché. Il apparaît que sur 80 électeurs, 42 déclarent qu’ils voteront pour lui (et 38 pour son concurrent, les indécis n’étant pas comptabilisés). Dommage pour ce candidat, il est battu quelques jours plus tard avec 49 % des suffrages exprimés. Va-t-il traiter ses militants d’incapables ?

A posteriori, on sait que la probabilité de vote favorable est de 0,49. Les militants l'ignoraient mais la variable aléatoire X, nombre de votants favorables, suivait une loi binomiale B(80 ; 0,49).

La règle de décision peut s'énoncer ainsi :

Soit f la fréquence observée (c'est-à-dire 42 / 80, donc 0,525).

- Si f appartient à l'intervalle de fluctuation, on accepte l'hypothèse selon laquelle l'échantillon était correctement choisi au seuil de 95 %.

- Si f n'appartient pas à l'intervalle de fluctuation, on rejette l'hypothèse selon laquelle l'échantillon était correctement choisi au seuil de 95 %.

L’utilisation des calculatrices TI-82 STATS et TI-83 est détaillée en page loi binomiale à la calculatrice. Complétons ce mode d’emploi par une recherche d’intervalle.

Nous allons établir une table avec, pour chaque nombre possible de réponses positives (donc 0,1, 2, ... 80), la probabilité théorique d'obtenir au plus ce nombre.

Créons d’abord une liste d’entiers naturels qui se suivent : touche 2nd pour bénéficier de la touche LIST ou listes (selon que le modèle est en anglais ou en français). Dans le menu, choisir OPS. Choix 5 (seq ou suite). En l’occurrence, on entre (x,x,0,80) puis touches STO et 2nd L1 (le x s'obtient avec la touche alpha). Cette procédure vous évite d'entrer chaque valeur de 0 à 80 dans la première liste de l'éditeur statistique.

À présent, touches 2nd, puis DISTR ou distrib. Choix A :binomFRép ou binomcdf (selon la langue de la calculatrice) puis entrez les deux paramètres de la loi. Affectez les résultats à une liste L2 (STO puis L2. Entrée).

Les deux opérations sont indiquées ci-dessous à gauche. À droite, il s'agit juste d'une vérification dans l'éditeur statistique.

calculatrice listes

Vous remarquez que les probabilités qui apparaissent sur l'écran de droite sont quasi nulles. Comme le candidat a obtenu près de la moitié des voix, la probabilité est infime de n'avoir aucun vote favorable ou très peu sur un échantillon de 80 électeurs.

Cherchons ensuite les valeurs correspondant aux probabilités cumulées de 0,025 et 0,975.

Nous obtiendrons ainsi les deux bornes de l’intervalle puisqu’en laissant 0,025 de chaque côté de la distribution, l’intervalle comprendra bien 95 % de celle-ci. Deux techniques : soit faire défiler L2 dans l’éditeur statistique (option un peu longue mais facile), soit utiliser la fonction SOMME. Le défilement donne ceci :

borne 1 borne 2

Pour la beauté du geste, employons aussi la fonction SOMME.

Allez dans le menu des listes (2nd STAT) et choisir MATH. La somme correspond au choix 5. Demandez que L2 soit inférieur ou égal à 0,025. Le signe ≤ se trouve dans le menu test (2nd MATH) en choix 6. Procédez de la même manière pour 0,025 et 0,975.

bornes

Ceci signifie qu’il y a 95 chances sur 100 pour que le nombre de votes favorables sur un échantillon de 80 électeurs se situe entre 30 et 48. Les militants en avaient trouvé 42.

Prise de décision : le candidat malheureux ne traitera pas ses militants d’incapables, d’abord parce qu’il est reconnaissant de leur dévouement et ensuite parce que ce nombre de 42 est parfaitement compatible avec l’intervalle de fluctuation au seuil de 5 %. De toute façon, il était bien trop hasardeux de se limiter à un échantillon de 80 électeurs seulement pour une problématique d'élection.

Le résultat est proche de ce que nous aurions trouvé avec la formule de seconde, soit [30 ; 49].

Afin de satisfaire votre légitime curiosité, voici à quoi ressemble la distribution de la loi B(80 ; 0,49) avec intervalle de fluctuation à 95 % (réalisation sur Excel) :

loi binomiale et intervalle de fluctuation

Voir aussi l'exercice en page exercice sur la loi binomiale, partie 2 (niveau première).

 

intervalle

 

© JY Baudot - Droits d'auteur protégés