Deux exercices sur tailles d'échantillons

Applications de l'inégalité de concentration

Nous vous proposons ici des exercices de niveau terminale générale (spécialité maths) pour appliquer l’inégalité de concentration à des situations plus ou moins concrètes. Le but sera chaque fois de déterminer une taille d’échantillon.

Dans les deux exercices, \(n\) sera un entier naturel non nul.

 

Exercice 1

On effectue \(n\) tirages successifs (avec remise) d’une carte parmi les cœurs d’un jeu de 32 (il y a donc huit cartes). Une figure rapporte un point, une autre carte ne rapporte rien. Notons \(X\) la variable aléatoire qui prend, pour un tirage donné, la valeur 1 si la carte est une figure (il y en a trois) et 0 sinon.

1- Quelle loi suit \(X\) ? Quelles sont son espérance et sa variance ?

La moyenne obtenue sur un échantillon de \(n\) tirages est noté \(\overline{Y}_n.\)

2- Déterminer l’inégalité de concentration liée à \(Y_n.\)

3- Combien de tirages faut-il répéter au minimum pour être sûr à \(95\%\) d'obtenir une fréquence de figures qui soit strictement comprise entre 0,35 et 0,4 ?

 

Corrigé 1

1- Nous sommes en présence d'une expérience aléatoire à deux issues pouvant être considérées comme succès ou échec (valeurs de \(X\) de 1 ou 0). Donc \(X\) suit une loi de Bernoulli.

Il faut d’abord établir \(E(X).\) Comme trois cartes sur huit rapportent un point, \(E(X) = \frac{3}{8} = 0,375.\)

Passons à \(V(X).\) D’après la formule de la variance d’une loi de Bernoulli (voir les lois discrètes), \(V(X)\) \(=\) \(0,375 × 0,625\) \(=\) \(0,234375\)

2- Rappelons l’inégalité de concentration :

\(P\left( {|{{\overline Y}_n} - m| \geqslant a } \right) \leqslant \frac{{{\sigma ^2}}}{{n{a ^2}}}\) avec \(a > 0,\) \(m\) espérance de \(X\) et \(\sigma ^2\) variance de \(X.\)

Adaptons l'inégalité de concentration pour tout \(a > 0\) :

\(P(|\overline {Y} _n - 0,375| \geqslant a) \leqslant \frac{0,234375}{na^2}\)

3- Nous cherchons \(P(0,35 < Y_n < 0,4) > 0,95\)

Mais \(0,35 < Y_n < 0,4\) peut s’écrire \(|Y_n - 0,375| < 0,025\)

Reformulons : \(P(|Y_n - 0,375| < 0,025)  > 0,95\)

En utilisant l’évènement contraire…

\(P(|Y_n - 0,375| \geqslant 0,025) \leqslant 0,05\)

Écrivons l’inégalité de concentration avec \(a = 0,025.\)

\(P(|Y_n - 0,375| \geqslant 0,025) \leqslant \frac{0,234375}{n × 0,025^2}\)
\(⇔ P|Y_n - 0,375| \geqslant 0,025) \leqslant \frac{375}{n}\)

Posons \(\frac{375}{n} = 0,05\)

D’où \(n = 7500\)

Il faut au moins 7 500 tirages pour être sûr à \(95\%\) d’obtenir une part de figures comprise dans l’intervalle \([0,35\, ; 0,4].\)

 

Exercice 2

On joue à pile ou face. Pour cela, on lance une pièce de monnaie \(n\) fois de suite. On la suppose équilibrée (en fait, c’est la pièce de 6 livres de 1793 représentée ci-dessous et l’on n’est pas très sûr qu’elle soit équilibrée, d’où l’importance de cet exercice).

1- On appellera \(X_n\) le nombre de piles obtenus en \(n\) lancers. Calculer l’espérance \(E(X_n)\) et la variance \(V(X_n).\)

2- Soit \(F_n\) la fréquence d’apparition de piles après \(n\) lancers. Poser l’inégalité de concentration sachant que le risque de se tromper doit être inférieur à \(5\%\) et que la proportion de piles doit se situer entre \(49,98\%\) et \(50,02\%.\)

3- Déterminer le nombre de lancers pour satisfaire ces deux conditions.

 

Corrigé 2

C'est grosso modo le même exercice, seules les valeurs diffèrent.

1- Vous avez flairé que la loi binomiale n’était pas loin. En effet, le jeu est modélisable par un schéma de Bernoulli (avec espérance de 0,5 et variance de 0,25) répété \(n\) fois de façon identique et indépendante. Donc \(X_n\) suit la loi \(\mathscr{B}(n\, ;0,5).\)

Nous en déduisons que son espérance est \(E(X_n) = 0,5n\) et sa variance \(V(X_n) = 0,25n.\)

2- Ici, \(a = 0,02.\)

\(P\left( {|{F_n} - 0,5| \leqslant 0,02} \right) > 0,95\)

Travaillons cette expression puisque les sens des inégalités ne correspondent pas à notre formule.

\(1 - P\left( {|{F_n} - 0,5| \geqslant 0,02} \right) > 0,95\)
\((\Leftrightarrow P\left( {|{F_n} - 0,5| \geqslant 0,02} \right) \leqslant 0,05\)

Selon l’inégalité de concentration, \(P(|F_n - 0,5| \geqslant 0,02) \leqslant \frac{0,25}{n × 0,02^2}\)

3- Posons \(0,05 = \frac{0,25}{n × 0,02^2}\)

\(\Leftrightarrow n = \frac{0,25}{0,05 \times 0,02^2}\)

\(\Leftrightarrow n = 12500\)

Il faut compter 12 500 lancers pour être certain à \(95\%\) d'obenir une fréquence de piles comprise dans l'intervalle \([0,4998\,; 0,5002].\)