Lois de Bernoulli, binomiale et hypergéométrique
Bienheureuse loi binomiale, qui fait le lien entre analyse combinatoire et lois de probabilités… Pour l’introduire, il est habituel d’évoquer préalablement la loi de Bernoulli. Alors procédons aux présentations. La loi de Bernoulli Il s’agit d’une loi discrète et fort simple. Une variable aléatoire ne peut prendre que deux valeurs, 0 (échec) et 1 (succès). Cette variable est parfois appelée variable de Bernoulli. À titre d'exemple, la réponse oui / non à une enquête est une variable de Bernoulli, tout comme l'événement "participe ou non à l'enquête". On dira que la probabilité qu’elle prenne la valeur 1 est égale à p, qui est l’espérance mathématique de la loi. On peut écrire P(X = 1) = p. Évidemment, la probabilité d’obtenir un zéro est de 1 – p. Et croyez-moi ou non, la variance est égale à p(1 – p). La loi binomiale Si l’on réitère n fois l’épreuve de Bernoulli de façon indépendante, et avec chaque fois cette même probabilité de succès p, alors nous sommes en présence d’une loi binomiale. Espérance et variance sont les mêmes que pour la loi de Bernoulli, mais multipliées par n. Si vous cherchez le mode, c'est la valeur entière comprise entre np – (1 – p) et np + p. Le skewness est égal à 0 (voir aussi page kurtosis). La formule déterminant la probabilité que la variable aléatoire prenne la valeur k est bien connue :
Je ne prendrai pas pour exemple des tirages de boules dans une urne. Question de principe. Nous ne sommes pas dans un désert de créativité ici… Donc, autre exemple. Une machine-outil produit 1,2 % de pièces défectueuses. On contrôle 40 pièces prises au hasard (sachant qu’une pièce inspectée est remise avec les autres et peut éventuellement être revérifiée). Quelle est la probabilité de contrôler 2 pièces défectueuses ? On a n = 40, p = 0,012 et k = 2.
Un arbre de probabilité permettrait de retrouver ce résultat mais, avec 40 tirages, il serait particulièrement énorme et son bénéfice pédagogique assez maigre... On s'en passera. Soit dit en passant, les valeurs de la combinaison (premier terme de la multiplication ci-dessus) peuvent être retrouvées par le triangle de Pascal puisque cette loi n'est ni plus ni moins qu'une application du binôme de Newton, comme son nom l'indique. Bref, si n est grand, c'est-à-dire au moins une trentaine d'observations, la loi binomiale peut être approximée par une loi normale d'espérance np. Son écart-type est la racine carrée de npq. L'approximation est réalisable par une loi de Poisson si p est petit (np devient alors le paramètre lambda de cette loi). C’est manifestement le cas de l’exemple ci-dessus. Reprenons la formule de la loi de Poisson, où np = 40 × 0,012 = 0,48 :
Au niveau de précision choisi, les résultats sont donc identiques. Notation de la loi binomiale :
Ajoutons que si l'exemple choisit consistait à trouver un nombre précis de pièces, il est fréquent qu'une recherche porte sur un INTERVALLE (par exemple, AU MOINS deux pièces défectueuses). On peut alors additionner les probabilités mais c'est juste une technique que des enseignants retors réservent à leurs étudiants. On peut aussi utiliser une table de probabilités cumulées mais on ne la trouve pas partout. La solution la plus simple est de disposer d'un tableur. La probabilité de 0,071 ci-dessus est obtenue immédiatement avec le classeur (gratuit) d'OpenOffice : =LOI.BINOMIALE(2;40;0,012;0). Pour un exemple avec Excel et des probabilités cumulées, voir en bas de page test des signes. La loi hypergéométrique Cette loi au nom effrayant est très proche de la précédente. La seule différence est qu’une même pièce, ou un même individu, ne peut être tiré au sort DEUX fois. Il s’agit donc d’un tirage exhaustif. La loi hypergéométrique fait intervenir deux paramètres de taille : celui de l’échantillon (n) et celui de la population (N). Si N est très élevé, on n’utilise pas cette loi car sa formule est tout de même un peu alambiquée et il est plus pratique de l’approximer, selon le cas, par la loi binomiale (si taux de sondage < 10 %), la loi normale ou la loi de Poisson. L’espérance est la même que celle de la loi binomiale, à savoir np. En revanche, la variance est forcément un tout petit peu inférieure puisqu’à chaque tirage on retire une observation de l’échantillon :
L’expression de la loi hypergéométrique est la suivante :
Cette formule n'est pas forcément utile à connaître, à moins de devoir la programmer ! Elle permet néanmoins de comprendre le test exact de Fisher. Mais c'est une autre histoire.
|




