Théorème de Moivre-Laplace et corollaire
Le théorème de Moivre-Laplace figurait jadis au programme de terminale générale. Il nous apprend qu’une loi binomiale peut être approximée par une loi normale. C’est une excellente nouvelle mais modérons notre euphorie car il existe quelques conditions restrictives…
Quel intérêt ?
Depuis la démocratisation des ordinateurs, on peut se demander quel est l’intérêt d’approximer une loi de probabilité théorique par une autre. Eh bien justement, les ordinateurs ne sont pas tout puissants. Essayez de calculer un coefficient binomial avec un effectif \(n = 10\,000,\) pour voir…
En page d'intervalle de fluctuation asymptotique vous est présenté un autre intérêt : estimer si une fréquence calculée sur un échantillon et qui obéit à une loi binomiale peut être considérée comme proche d'une proportion connue a priori (et qui n'est évidemment pas un entier naturel).
Le théorème
Soit \(n\) un entier naturel non nul et \(p\) une probabilité. Soit \(X\) une variable aléatoire (v.a) qui suit une loi binomiale \(\mathscr{B}(n\,;p).\)
Vous le savez sans doute, on construit une variable aléatoire \(Z\) à partir de \(X\) (voir la page loi normale centrée réduite).
\(\displaystyle{Z_n = \frac{X_n - np}{\sqrt{np(1-p)}}}\)
Le théorème énonce que pour les réels \(a\) et \(b\) (avec \(a \leqslant b\))…
\(\mathop {\lim }\limits_{n \to + \infty } P(a \leqslant Z_n \leqslant b)\) \(\approx\) \(\displaystyle{\int_{a}^{b} {\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^2}{2}}} dx}\)
En d’autres termes, lorsqu’on travaille sur un échantillon très grand, on peut faciliter ses calculs en remplaçant la loi binomiale par la loi normale (les statisticiens parlent de convergence en loi). \(Z\) suit donc une loi normale centrée réduite.
Restrictions
En pratique, les effectifs infinis n’existent pas. Mais on considère que pour \(n \geqslant 30\) l’approximation est valable.
D’autres conditions existent. Si vous consultez plusieurs livres ou sites, vous ne trouverez pas toujours les mêmes car il n’y a pas de consensus. En classe de terminale, on donne \(np \geqslant 5\) et \(n (1 - p) \geqslant 5.\) Comme nous le verrons plus loin à la faveur d’un exemple, ces conditions sont très peu contraignantes, ce qui conduit à des à-peu-près…
Corollaire (intervalle de fluctuation asymptotique)
Supposons une v.a suivant une loi binomiale, les conditions d’approximation étant réunies. Pour une probabilité de succès donnée, on peut déterminer un intervalle de fluctuation dans lequel doit se situer une fréquence donnée.
Reprenons notre v.a \(X\) centrée (on lui soustrait l’espérance de sa loi de probabilité) et réduite (on la divise par l’écart-type). Elle prend une valeur comprise entre \(a\) et \(b.\)
Pour alléger les formules, posons \(q = 1 - p.\)
\(\displaystyle{ a \leqslant \frac{X - np}{\sqrt{npq}} \leqslant b}\)
Faisons disparaître ce dénominateur disgracieux.
\(a \sqrt{npq} \leqslant X - np \leqslant b \sqrt{npq}\)
Isolons la v.a.
\(a \sqrt{npq} + np\) \(\leqslant\) \(X\) \(\leqslant\) \(b \sqrt{npq} + np\)
Divisons par \(n\) de façon à faire apparaître la v.a fréquence.
\(\displaystyle{\frac{a \sqrt{npq}}{n} + \frac{np}{n}}\) \(\leqslant\) \(\displaystyle{\frac{X}{n}}\) \(\leqslant\) \(\displaystyle{\frac{b \sqrt{npq}}{n} + \frac{np}{n}}\)
Simplifions.
\(\displaystyle{p + a \frac{\sqrt{pq}}{\sqrt{n}}}\) \(\leqslant\) \(\displaystyle{\frac{X}{n}}\) \(\leqslant\) \(\displaystyle{p + b \frac{\sqrt{pq}}{\sqrt{n}}}\)
Appelons \(F\) la v.a fréquence et reformulons dans une problématique probabiliste l’inégalité que nous venons de transformer.
\(\displaystyle{ \left( a \leqslant \frac{X - np}{\sqrt{npq}} \leqslant b \right)}\) \(=\) \(\displaystyle{P \left(p + a \frac{a\sqrt{pq}}{\sqrt{n}} \leqslant F \leqslant p + b \frac{\sqrt{pq}}{\sqrt{n}}\right)}\)
D’après le théorème de Moivre-Laplace, lorsque \(n\) est infiniment grand, on peut remplacer dans le premier membre de l’égalité la v.a encadrée par \(Z,\) v.a qui suit la loi normale centrée réduite.
Si nous choisissons pour valeurs de \(a\) et \(b\) un réel positif \(u\) et son opposé, nous savons que (Cf. p. intervalles associés à une probabilité de loi \(\mathscr{N}(0\,;1)\)) :
\(P(-u \leqslant Z \leqslant u)\) \(=\) \(1 - \alpha\)
Par conséquent…
\(\displaystyle{\mathop {\lim }\limits_{n \to + \infty } P \left( p - u \frac{\sqrt{pq}}{\sqrt{n}} \,; p + u \frac{\sqrt{pq}}{\sqrt{n}} \right)}\) \(=\) \(1 - \alpha\)
Exemple
Soit \(X\) une v.a qui suit la loi binomiale \(\mathscr{B}(50\,; 0,2).\) Déterminons la probabilité \(P(8 \leqslant X \leqslant 12).\)
Utilisons la calculatrice comme indiqué en page fluctuation d’échantillonnage (en l’occurrence une TI-82).
L’écran ci-dessus montre les probabilités cumulées. \(P (X \leqslant 12) - P(X \leqslant 7)\) \(=\) \(0,62353.\)
Nous avons \(n = 50,\) \(np = 10\) et \(nq = 40.\) Nous pouvons procéder à une approximation par la loi normale. Voyons si le résultat obtenu est proche du précédent.
L’espérance est égale à 10 (soit \(50 × 0,2\)) et la variance est égale à 8 (soit \(50 × 0,2 × 0,8\)).
Nous avons donc, au millième près :
\(\displaystyle{P \left( \frac{8 - 10}{\sqrt{8}} \leqslant Z \leqslant \frac{12 - 10}{\sqrt{8}} \right)}\)
\(= P(-0,707 \leqslant Z \leqslant 0,707)\)
Avec la calculatrice, on trouve 0,52043 environ, ce qui est plutôt éloigné du résultat trouvé avec la loi binomiale ! Pourquoi ? La condition \(np \geqslant 5\) n’est dépassée que de justesse. Ainsi, la capture d’écran ci-dessus montre des sauts importants entre les différentes valeurs de \(X\) autour de l’espérance.
Le fait que les inégalités soient strictes ou larges ne joue pas si la loi normale est utilisée puisqu’elle est continue, mais il n’en est pas de même avec la loi binomiale : ainsi, \(P(8 < X \leqslant 12)\) \(=\) \(0,50661,\) \(P(8 \leqslant X < 12)\) \(=\) \(0,52026\) (résultat cette fois-ci très proche) et \(P(8 < X < 12)\) \(=\) \(0,40334.\)