Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

Les fonctions de répartition

logo

 

 

 

 

 

 

 

 

 

 

Fonctions de répartition discrètes, continues et empiriques

La fonction de répartition (distribution function) est une notion clé de la théorie des probabilités. Elle indique, pour la valeur donnée prise par une variable aléatoire (v.a), un cumul de probabilités.

Discrète ou continue

Soit une fonction F associée à une v.a X. F est une fonction de répartition si F(x)P( x).

Cette fonction est croissante sur R. Elle varie de 0 à 1, autrement dit :

limites 0 et 1

Si la v.a est discrète, il s’agit d’une fonction en escaliers. Soit pi la probabilité que X prenne la valeur xi.

Appliquons la propriété des probabilités totales :

F(x)=somme p

Cette somme est finie si l’ensemble de définition est fini et infinie si cet ensemble est infini dénombrable (loi de Poisson, par exemple).

Si la v.a est continue

intégrale

Dès lors, vous comprenez pourquoi la fonction de répartition s’écrit généralement avec un F majuscule (c'est une primitive de la fonction de densité).

L’un de ses intérêts les plus immédiats est de donner immédiatement la probabilité P( x) mais aussi, pour a et b réels avec a < b, P(a < X  b). En effet, il est évident que P(a < X  b) = F(b) – F(a).

Pour visualiser le lien entre les fonctions de densité et de répartition, prenons l’exemple très simple de la loi normale centrée réduite. La probabilité pour qu’une valeur de x soit inférieure à 0 s'établit à 0,5.

Si l’on illustre ceci avec la courbe représentative de la fonction de densité, nous obtenons ceci (avec Geogebra) :

densité

Quant à la courbe représentant la fonction de répartition, elle contient le point de coordonnées (0 ; 0,5) :

répartition

La représentation la plus simple est celle de la fonction de répartition d’une loi uniforme :

loi uniforme

Fonction de répartition empirique

Soit un échantillon de n observations. Celles-ci sont triées par valeurs croissantes de xi, valeurs prises par une variable aléatoire X.

La fonction de répartition empirique Fn est une fonction en escaliers. Elle est définie ainsi :

Si x < x1, Fn(x) = 0

Si x ≥ xn, F(x) = 1

F est constante sur [xi ; xi+1[.

Chaque marche a une hauteur de 1 / n.

En général, cette fonction n’a pas d’expression algébrique mais sa représentation graphique est très simple à tracer.

On démontre que Fn(x) converge presque sûrement vers la fonction de répartition réelle F(x).

On démontre aussi que la v.a que constitue l’écart maximal entre Fn(x) et F(x) tend vers 0 (convergence presque uniforme). C’est le théorème de Glivenko-Cantelli dit encore théorème fondamental de la statistique puisqu’il justifie de façon mathématique l’emploi d’échantillons pour représenter les populations. La notation de cette v.a n’est pas fixée : D, Dn, Xn… C’est la statistique de Kolmogorov.

Le test de Kolmogorov-Smirnov se fonde sur sa loi de probabilité.

Note : on utilise des fonctions de répartition multivariées pour des couples et des n-uples de v.a.

 

répartition

 

© JY Baudot - Droits d'auteur protégés