De la loi binomiale à la loi normale centrée réduite
Un véritable monument statistique. La visite est gratuite, profitez-en…
Comment aborder la loi normale centrée réduite ? Une option est de montrer son importance grâce aux applications qu’elle permet. C’est celle de la page sur la loi normale (dont la centrée réduite est un cas particulier). Une approche plus modeste, privilégiée ici, consiste à l’introduire par la loi binomiale (et c'est la centrée réduite qui pourra ensuite introduire la loi normale de paramètres quelconques). Selon la façon dont la loi normale (ou de Gauss) vous est enseignée, vous privilégierez soit cette page, soit l'autre.
Loi binomiale
Les notations qui vont suivre sont les suivantes : \(p\) est la probabilité de succès, \(q = 1 - p\) et \(n\) est le nombre d’épreuves de Bernoulli identiques et indépendantes qui impliquent l’utilisation d’une loi binomiale.
La distribution d’une loi binomiale a une forme bien caractéristique. Les valeurs d’une variable aléatoire (v.a) \(X\) qui suit cette loi présentent des probabilités d’occurrence élevées lorsqu’elles se situent autour de l’espérance et plus faibles au fur et à mesure qu’elles s’en éloignent. Ci-dessous figure la distribution de la loi binomiale \(\mathscr{B}(40\,;0,4)\) réalisée avec Excel. On lit par exemple que si l’on répète 40 fois une même épreuve de Bernoulli de façon indépendante avec une probabilité de succès de 0,4, alors la probabilité d’obtenir 17 succès est d’environ 0,12.
Procédons à un changement de variable.
\(Z_n = \displaystyle{\frac{X_n - np}{\sqrt{np(1-p)}}}\)
Nous avons centré et réduit \(X\) pour obtenir \(Z.\) Le « centrage » consiste à soustraire \(np\) (espérance d’une loi binomiale) de la v.a \(X\) et la « réduction » consiste à diviser cette différence par la racine carrée de \(npq\) (donc par son écart-type). Dans notre exemple, cela donne…
\(Z_n = \displaystyle{\frac{X_n - 16}{\sqrt{9,6}}}\)
Le milieu de la distribution correspond alors à la valeur 0. Par ailleurs, l’intervalle dans lequel se trouve la majeure partie de la distribution de \(Z\) est moins étendu. Ci-dessous, seul l’axe des abscisses a changé par rapport au graphe précédent.
Plus \(n\) est élevé, plus le graphique en barres est lissé et ressemble à une courbe. On le constate ci-dessous avec la représentation de \(Z\) lorsque \(X\) suit la loi binomiale \(\mathscr{B}(500\,;0,4).\)
\(Z_n = \displaystyle{\frac{X_n - 200}{\sqrt{120}}}\)
\(95\%\) de la distribution se trouve en zone verte, c’est-à-dire entre -2 et 2 environ.
Loi normale centrée réduite
Soit à présent la fonction de densité \(f\) définie comme suit : \(f(x) = \frac{1}{\sqrt{2 \pi}} \exp\left(-\frac{x^2}{2}\right)\)
Selon le théorème de Moivre-Laplace, plus \(n\) est grand et plus l’approximation de \(Z\) par \(f\) est correcte. La loi de probabilité discrète de \(Z\) peut donc être approximée par une loi de probabilité continue : la loi normale centrée réduite.
Ci-dessous figure la représentation graphique de sa fonction de densité, réalisée avec une calculatrice TI-83. La partie sombre est obtenue à partir de la fonction calcul intégrale. C’est l’aire comprise entre les valeurs -1,96 et 1,96. Elle est environ égale à 0,95 (voir les intervalles associés à une loi normale centrée réduite).
La fonction \(f\) est paire (la courbe est symétrique par rapport à l’axe des ordonnées). Elle présente bien sûr les caractéristiques d’une fonction de densité (positive, continue, aire sous courbe = 1). Par ailleurs, la courbe présente deux points d’inflexion, en -1 et 1.
La ressemblance avec la distribution de \(Z\) saute aux yeux. Les intervalles de fluctuation sont quasiment les mêmes, comme on le constate dans les deux cas ci-dessus : la probabilité que la v.a prenne une valeur comprise entre -2 et 2 (environ) est 0,95.
L’espérance de la loi normale centrée réduite est nulle et sa variance est égale à 1 (et donc son écart-type également). On la note \(\mathscr{N}(0\,;1)\)
Remarquez que les deux paramètres de la loi normale centrée réduite sont toujours les mêmes. Celle-ci est donc UNIQUE. Les valeurs qu’elle prend font l’objet de tables (voir la loi normale sur tableur) et les plus usitées peuvent être apprises par cœur : nous avons vu que la probabilité qu’a la v.a de se trouver dans l’intervalle \(\pm 1,96\) est très proche de 0,95. Celle de se trouver dans l’intervalle \(\pm 2,58\) environ est 0,99. Celle de se trouver dans l’intervalle \(\pm 1\) est d’environ 0,68.
Ainsi, les valeurs pour lesquelles \(f\) est définie sont des écart-types par rapport à la moyenne. On peut donc dire que, si une v.a suit une loi normale, la probabilité qu’un évènement se situe dans la moyenne \(\pm 1,96\) écart-type est de 0,95.
Pour une approximation d’une loi binomiale, voir l’exemple 2 de la page d'exemples d’utilisation de la loi normale.