Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

Le théorème de Bayes

logo

 

 

 

 

 

 

 

 

 

 

Théorème de probabilité des causes

Ne tombons pas dans la facilité pour constater que le théorème de Bayes a fait « couler beaucoup d’encre », mais il a tout de même fait graver pas mal de mégaoctets. En effet, le révérend Thomas Bayes (prononcer Baïz) aurait été surpris que son « théorème », publié après sa mort (survenue en 1761), devienne une branche si féconde et si controversée des statistiques probabilistes.

Pourquoi controversée ? G. Saporta in Probabiltés, analyse des données et statistiques (Technip 2006) p. 10 : « le théorème de Bayes est souvent appelé théorème sur la « probabilité des causes » (…). Son application générale a donné lieu à de violentes critiques de la part des logiciens pour qui causalité et aléatoire sont antinomiques : il n’y a qu’une cause possible parmi des causes mutuellement exclusives et leur donner des probabilités n’aurait aucun sens. »

Principe

Si vous avez quelques notions de probabilités, vous connaissez depuis la terminale la formule des probabilités conditionnelles :

proba conditionnelle

Précision : P(A / B) s'écrit aussi PB(A).

Si A et B sont deux évènements, la probabilité que A se produise sachant B réalisé est égale à la probabilité que les deux évènements surviennent au cours de la même épreuve, rapportée à la probabilité que B survienne. Si cette formule ne vous semble pas suffisamment intuitive, vous pouvez vous référer aux arbres de probabilités...

Dans sa version simple, le théorème ou formule de Bayes en découle :

formule simple

Cette formule fait le lien entre les deux probabilités conditionnelles P(A/B) et P(B/A). Si l'on connaît une probabilité de B sachant A, alors on peut connaître la probabilité de A sachant B. C'est une question habituelle au bac, bien que la formule telle qu'elle est présentée ici ne soit pas au programme de terminale.

S’il existe plusieurs évènements C possibles on obtient la version composée de la formule de Bayes. Au dénominateur se trouve la formule des probabilités totales. Remarquons que le théorème mérite son appellation de probabilité des causes puisqu’en pratique, on peut calculer la probabilité d’une cause sachant la conséquence. Ainsi, si un résultat B peut être dû à trois causes possibles C et si l’on cherche la probabilité que B est dû à C1, la formule est la suivante :

formule composée

Exemple

Dans un établissement financier, un dossier de crédit affecté arrive au service des recouvrements (au premier impayé) dès sa première année. Que peut-il arriver ? Soit le client règle la situation mais le dossier reviendra un jour en recouvrement (50 % des cas), soit c’est un simple incident et tout se passera bien ensuite (25 %) soit le dossier de crédit finira sa course au service du contentieux juridique (25 %).

Initialement, le dossier a pu être accepté avec un apport financier du client ou non puisqu'un crédit peut très bien ne financer que partiellement un achat. Et à ce propos, on a remarqué que 30 % des dossiers qui reviendront en recouvrement bénéficiaient d’un apport personnel, contre 20 % pour ceux qui termineront au service contentieux et 50 % pour les dossiers qui redeviendront « sans histoire ».

Afin que la lettre de relance au client ait un maximum de chances d'être adaptée à la situation, on détermine la probabilité qu’un dossier avec apport transmis au service du recouvrement dès la première année n’enregistre pas d’autre incident de paiement.

Soit R1 l'évènement Recouvrement en première année, R2 l'évènement Retour en recouvrement, B tout se passe Bien, C entrée en Contentieux et A le fait qu'un crédit s'accompagne d'un apport (nous noterons sa probabilité P(A) mais en toute rigueur il s'agit de P(A/R1)).

Nous cherchons donc à connaître P(B/A).

Quelle valeur sera au dénominateur de la formule ? Pour cela, nous appliquons la propriété des probabilités totales aux dossiers avec apport : P(A)P(A/R2) + P(A/C) + P(A/B).

Soit (0,5 × 0,3) + (0,25 × 0,2) + (0,25 × 0,5) = 0,325.

Au numérateur, nous avons P(B) × P(A/B), c'est-à-dire P(A  B).

Donc nous multiplions P(B) = 0,25 par P(A/B) = 0,5, soit P(A  B) = 0,125.

Ainsi la réponse à la question est 0,125 0,325 ≈ 0,385. En d’autres termes, il y a 25 % de chances qu’un dossier redevienne sain mais, si l’on sait que c’est un dossier avec apport, on atteint 38,5 % de chances.

Merci, révérend Bayes.

 

il rentre du café

 

© JY Baudot - Droits d'auteur protégés