Lois de Bernoulli et binomiale
Bienheureuse loi binomiale, qui montre tout l'intérêt de l'analyse combinatoire dans le cadre des lois de probabilité… Pour l’introduire, il est habituel d’évoquer préalablement le schéma de Bernoulli et la succession d'évènements indépendants. C'est d'ailleurs ainsi que la loi binomiale est abordée dans le secondaire. Si précisément vous êtes lycéen(ne), quelques passages de cette page risquent d'être franchement hors programme mais dans l'ensemble vous devriez y trouver de quoi balayer vos incertitudes, surtout si vous en complétez la lecture par celle des pages sur le coefficient binomial, l'initiation à la loi binomiale (terminales technologiques), la loi binomiale avec démonstration (terminale générale), la loi binomiale à la calculatrice et l'exercice sur la loi binomiale.
La loi de Bernoulli
Il s’agit d’une loi discrète fort simple. Une variable aléatoire (v.a.) ne peut prendre que deux valeurs, 0 (échec) et 1 (succès). Au départ, il s'agit d'un choix arbitraire. Il faut juste définir ce qui sera considéré comme succès. Au sens probabiliste, le succès est une réponse positive à une question qui n'implique aucun jugement de valeur. Si l'on cherche des appareils en panne, alors le fait de trouver un appareil qui fonctionne est assimilé à un échec...
Cette v.a. binaire est parfois nommée variable de Bernoulli. À titre d'exemple, la réponse oui ou non à une enquête est une variable de Bernoulli.
Par convention, on note \(p\) la probabilité que cette variable prenne la valeur 1 (donc, succès). C'est l’espérance mathématique de la loi. On peut écrire \(P(X = 1) = p.\) Évidemment, la probabilité d’obtenir 0 est \(1 - p.\) Si par exemple on cherche l'espérance d'obtenir un six sur le lancer d'un dé, alors \(p = \frac{1}{6}\) (une chance sur six). La probabilité de rater le six s'établit à \(\frac{5}{6}.\)
Et croyez-le ou non, la variance est égale à \(p(1 - p).\) Vous ne le croyez pas ? Alors démonstration
D'après la définition de la variance :
\(V(X) = P(X = 1)(1 - E(X))^2 + P(X = 0)(0 - E(X))^2\)
\(\Leftrightarrow V(X) = p(1 - p)^2 + (1 - p)(0 - p)^2\)
\(\Leftrightarrow V(X) = (1 - p)[(p(1 - p) + p^2]\)
\(\Leftrightarrow V(X) = (1 - p)(p - p^2 + p^2)\)
\(\Leftrightarrow V(X) = p(1 - p)\)
La loi binomiale
Supposons que l’on réitère \(n\) fois la même épreuve de Bernoulli de façon indépendante, donc avec chaque fois cette même probabilité de succès \(p.\) Alors nous sommes en présence d'un schéma de Bernoulli et la probabilité d'obtenir \(k\) succès suit une loi binomiale. S'il n'y a pas indépendance, c'est en revanche et sous certaines conditions la loi hypergéométrique qui est employée. S'il y a bien indépendance, que \(n\) n'est pas fixé et que l'on cherche la probabilité d'obtenir un premier succès au bout de \(k\) épreuves, on utilise la loi géométrique.
Précision : lorsque la population est importante et que, selon le plan d'échantillonnage choisi, il est possible de tirer au sort deux fois le même individu, cette possibilité est infime. On peut alors utiliser la loi binomiale à la place de la loi hypergéométrique car son emploi est plus pratique et la probabilité cherchée sera la même.
Ces deux paramètres \(n\) et \(p\) suffisent pour caractériser une loi de probabilité binomiale. Pour exprimer le fait que la v.a. \(X\) suive une loi binomiale de paramètres \(n\) et \(p,\) on écrit \(X \sim \mathscr{B}(n\,; p).\)
La formule déterminant la probabilité que la v.a. prenne la valeur \(k\) est la suivante :
\(P(X = k) = \left( {\begin{array}{*{20}{c}}
n\\
k
\end{array}} \right){p^k}{(1 - p)^{n - k}}\)
Espérance et variance sont celles de la loi de Bernoulli mais multipliées par \(n\) (voir les propriétés de l'espérance). Si vous cherchez le mode, c'est la valeur entière comprise entre \(np - (1 - p)\) et \(np + p.\) Le skewness est égal à 0 (voir aussi la page sur le kurtosis).
Nous ne prendrons pas pour exemple des tirages de boules dans une urne. Question de principe. Nous ne sommes pas dans un désert de créativité ici…
Donc, autre exemple. Une machine-outil produit \(1,2\%\) de pièces défectueuses. On contrôle quarante pièces prises au hasard (sachant qu'après inspection une pièce est remise avec les autres et peut éventuellement être revérifiée). Quelle est la probabilité de contrôler deux pièces défectueuses ? On a \(n = 40,\) \(p = 0,012\) et \(k = 2.\)
\(P(X = 2)\) \(=\) \(\left( {\begin{array}{*{20}{c}}
{40}\\
2
\end{array}} \right) \times {0,012^2} \times {(1 - 0,012)^{38}}\) \(=\) \(0,071\)
Un arbre de probabilité permettrait de retrouver ce résultat mais, avec 40 tirages, il serait particulièrement énorme et son bénéfice pédagogique assez maigre... On s'en passera.
Soit dit en passant, la valeur de la combinaison (premier facteur de la multiplication ci-dessus, parfois nommé coefficient binomial) peut être retrouvée par le triangle de Pascal puisque cette loi n'est ni plus ni moins qu'une application du binôme de Newton, comme son nom l'indique. La combinaison permet de déterminer le nombre de branches de l'arbre pondéré qui satisfont à la condition \(X = k.\)
Sur un lot contrôlé, nul besoin d'être agrégé de maths pour deviner l'espérance du nombre de pièces défectueuses, soit \(40 × 0,012 = 0,48\) pièce.
Approximations
L'emploi de la loi binomiale n'est pas toujours très commode ; aussi peut-elle être approximée par d'autres lois de probabilité sous certaines conditions.
Si \(n\) est grand, c'est-à-dire au moins une trentaine de valeurs, et si \(p\) n'est pas trop proche de 0 ou de 1, la loi binomiale converge vers une loi normale d'espérance \(np.\) Son écart-type est la racine carrée de \(npq.\) C'est une application du théorème de limite centrée. Une illustration se trouve en page de seuil de rentabilité probabilisé.
L'approximation est réalisable par une loi de Poisson si \(p\) est petit (\(np\) devient alors le paramètre \(λ\) de cette loi). C’est manifestement le cas de l’exemple ci-dessus. Reprenons la formule de la loi de Poisson, où \(np = 0,48\) :
\[\frac{{{e^{ - 0,48}} \times {{0,48}^2}}}{{2!}} = 0,071\]
Au niveau de précision choisi, les résultats sont donc identiques.
Ajoutons que si l'exemple choisit consistait à trouver un nombre précis de pièces, il est fréquent qu'une recherche porte sur un intervalle (par exemple, AU MOINS deux pièces défectueuses). On peut alors additionner les probabilités mais c'est juste une technique que des enseignants retors réservent à leurs étudiants. On peut aussi utiliser une table de probabilités cumulées mais on ne la trouve pas partout. Il est possible d'obtenir une réponse avec une calculatrice mais la solution la plus simple est de disposer d'un tableur.
Les bienfaits du tableur
La probabilité de 0,071 ci-dessus est obtenue immédiatement avec Excel ou le classeur d'OpenOffice : =LOI.BINOMIALE(2;40;0,012;0). Pour des exemples avec Excel, voir la page sur la loi binomiale avec Excel et le bas de la page sur le test des signes.
Un tableur est l'outil idéal pour créer en quelques clics une table de loi binomiale ou un graphique représentatif. À titre d'exemple, le graphique en bâtons ci-dessous montre les probabilités pour chaque \(X = k\) de la loi binomiale \(\mathscr{B}(100\, ; 5).\) Accessoirement, ce type de graphique permet de visualiser des intervalles de fluctuation et des intervalles de confiance (voir la page sur la loi normale centrée réduite).