La variance d'une VA

Espérance et variance

Cette page s’inscrit dans le programme de maths de première générale. Comme la variance d’une variable statistique est au programme de seconde, vous ne découvrirez pas de quoi révolutionner votre existence puisque le calcul de variance d’une variable aléatoire discrète reste le même, dans une problématique différente.

Préalable à la lecture de cette page : l’initiation à une loi de probabilité discrète.

 

Espérance, variance, écart-type

Soit \(X\) une variable aléatoire (VA) qui prend \(m\) valeurs distinctes.

Son espérance mathématique est en quelque sorte la moyenne des valeurs prises par ses réalisations, soit \(x_1,\) \(x_2,\) … \(x_m\) pondérées par leurs probabilités respectives \(p_1,\) \(p_2,\) … \(p_m.\)

\(E(X)\) \(= \sum\limits_{i = 1}^m {{p_i}{x_i}}\) \( = {p_1}{x_1} + {p_2}{x_2} \) \(+ ... +\) \({p_m}{x_m}\)

La variance est l’espérance des carrés des écarts par rapport à l’espérance. Pour dire les choses plus simplement, \(V(X)\) \(= E\left((X-E(X)^2\right).\)

Ou encore : \(V(X)\) \(= p_1(x_1-E(X))^2\) \(+\) \(p_2(x_2-E(X))^2\) \(+\) \(…\) \(+\) \(p_m(x_m-E(X))^2\)

Une formule plus simple d'emploi, dite de König (ou König-Huygens), consiste à retrancher le carré de l’espérance de l’espérance des carrées : \(V(x) = E(X^2) – E(X)^2.\) La démonstration se trouve en page d’initiation à la variance statistique mais vous pourrez sans mal la transposer dans un contexte de variable aléatoire.

L’écart-type de la VA \(X\) est la racine carrée de sa variance.

\(σ(X) = \sqrt{V(X)}\)

L’espérance et l’écart-type sont exprimés dans la même unité que \(X\) au contraire de la variance, que l'on n'interprète pas (dans un problème concret, la variance n'a rien à faire dans une phrase réponse).

 

Propriétés

Nous nous limiterons aux propriétés suivantes :

\(E(aX + b) = aE(X) + b\)

\(V(aX + b) = a^2V(X)\) (démonstration en page de transformation affine d’une VA)

D’où \(σ(aX + b)\) \(= \sqrt{a^2} \sqrt{V(x)}\) \(=|a|σ(X)\)

 

Calculatrice

On utilise la calculatrice exactement comme pour déterminer la moyenne et l’écart-type d’une série statistique. Si les valeurs prises par la VA sont en liste 1, alors les probabilités correspondantes sont en liste 2 (comme s’il s’agissait d’effectifs). Voir les modes d’emploi de la TI-83 en page de statistiques avec TI et de la Casio GRAPH35+ en page de statistiques avec Casio.

 

Exemple

Prenons l’exemple de la page d’initiation aux lois de probabilité.

On lance un octaèdre régulier dont l’une des faces rapporte 4 points, deux faces rapportent 3 points et les cinq autres ne rapportent rien. La loi de probabilité est résumée ainsi :

loi de probas

Passons le détail du calcul. \(E(X) = 1.\)

Calculons la variance de deux façons différentes.

Avec la formule de la définition.

\(V(X)\) \(= 0,625(0-1)^2 + 0,25(2-1)^2 + 0,125(4-1)^2\) \(=2\)

Avec la formule de König.

\(V(X)\) \(=0,625 × 0^2 + 0,25 × 2^2 + 0,125 × 4^2 – 1^2\) \(=2\)

Par conséquent, l’écart-type s’établit à \(σ(X) = \sqrt{2}\)

 

Python

Vous pouvez programmez l’espérance et l’écart-type d’une VA avec Python soit pour vous entraîner, soit parce que vous ne disposez pas d’un module de statistique.

L’option choisie ci-dessous est de retenir la formule de la définition et non celle de König.

Comme nous aurons besoin de calculer la racine carrée de la variance pour obtenir l’écart-type, nous devons soit importer le module math en entier, soit la seule fonction sqrt.

from math import * ou from math import sqrt

Nous verrons que l’on peut aussi se passer de cette importation.

L’emploi de la fonction eval est très commode pour que l’utilisateur saisisse une liste après une invite. Rappelons au passage que les éléments de la liste doivent être séparés par des virgules tandis que les décimales utilisent des points.

Copie d’une proposition de programme (réalisé sur Spyder)

programme

Remarques :

  • Les lignes 5 et 6 peuvent être réunies en e,v = 0,0

  • La longueur de la liste len(X) peut être entrée dans une variable plutôt que d’apparaître dans les instructions de boucle.

  • Il est possible de se passer de l’importation de sqrt puisqu’une racine carrée n’est autre qu’une puissance 0,5. L’écart-type est alors obtenu par v**0.5 (notez qu’il n’est calculé qu’au moment de l’affichage).

  • Très souvent, l’indice des valeurs discrètes d’une série statistique est i alors qu’il est l’appelé k dans les algorithmes ! Nous avons respecté cette curiosité…

Dans notre exemple, la boucle tourne trois fois puisque la série comporte trois valeurs (0, 2 et 4). La variable e est donc initialisée à zéro, conserve cette même valeur après la première itération (\(0 + 0 × 0,625\)) puis passe à 0,5 (soit \(0 + 2 × 0,25\)) puis à 1 (soit \(0,5 + 4 × 0,125\)).

Lorsque la seconde boucle, qui calcule la variance, devient active, la valeur de e est établie. Après trois itérations la valeur de la variance est connue (voir plus haut la formule de la définition).

Évidemment, en pratique, il est beaucoup plus commode d’utiliser les fonctions mean et std pour l’espérance et l’écart-type…