La loi de Student-Fisher

Densité et moments de la loi de Student

Student était le pseudo de William Sealy Gosset, chimiste et statisticien de la brasserie Guiness à Dublin, décédé en 1937, qui nous a légué de bien précieux outils. En particulier une loi de probabilité, dite loi t de Student, également connue sous le nom de loi de Student-Fisher.

Employé au contrôle de qualité de la bière, Student se contentait d'analyser de petits échantillons par mesure d'économie. Il ne pouvait donc utiliser la loi normale pour estimer les paramètres de la production totale avec un risque d'erreur donné. Il établit donc une formule de distribution plus adaptée, modifiée quelques années plus tard par Ronald Fisher.

Le T de Student

Soit une variable aléatoire (v.a) définie comme le rapport entre une v.a Z qui suit la loi normale centrée réduite et la racine carrée d’une autre v.a Xn, indépendante de la première, qui suit une loi du khi² à n degrés de liberté (ddl) divisée par n. Cette v.a est notée de façon différente selon les auteurs : T, ST, ST(n)… Notons-la Tn.

Formellement…

T

Cette v.a suit une loi de Student à n ddl.

Expression de la fonction de densité

La fonction de densité de cette loi, définie sur R et continue, a une expression algébrique si compliquée qu'au fil de vos lectures vous en trouverez des formulations variables.

Le plus souvent, elle est définie à l'aide de la fonction gamma

fonction de densité

Pour n = 1, cette distribution est celle de Cauchy. Lorsque n tend vers l’infini, la v.a de Student converge en loi vers une v.a normale centrée réduite.

Moments

L’espérance de T est nulle. E(T) = 0 si n > 1.

Variance

Pour tout n entier > 2 :

var(T)=n/(n-2)

Asymétrie

La fonction de densité de probabilité est paire. Le coefficient d’asymétrie est donc nul.

Aplatissement

Pour n > 4 :

kurtosis

Représentations graphiques

Ci-dessous figurent trois représentations graphiques de la fonction de densité de la loi de Student, réalisées avec le logiciel libre Gretl.

La première courbe représente le cas où n = 1. Donc, la loi de Cauchy. Elle est relativement aplatie et les queues de distribution sont épaisses.

n=1

Pour la courbe suivante, n = 10. Il n’existe plus cette dispersion importante observée sur la configuration précédente.

n=10

Enfin, la courbe pour laquelle n = 30. Elle est un peu plus resserrée et très proche de la courbe représentant la fonction de densité de la loi normale centrée réduite.

n=30

C’est pourquoi, en pratique, la loi de Student n’est employée que sur de petits échantillons (moins d’une trentaine d’unités statistiques). Au-delà, on utilise la loi normale.

Voir aussi la page sur les utilisations de la loi de Student et la table du t de Student.