La loi de Fisher

Loi de Fisher-Snedecor

Bon, ce n’est pas cette loi de probabilité qui enthousiasme les foules et qui pousse la jeunesse à se ruer dans une filière statistique. Et pourtant…

Il est vrai qu’on ne s’amuse pas à comparer la distribution d’une population observée à la fonction de densité d’une loi de Fisher-Snedecor. Les quelques modèles habituels suffisent (loi normale, log-normale, loi de Poisson…). Non, l’utilité est tout autre.

 

Présentation

Cette loi est celle du rapport de deux variables aléatoires (v.a) indépendantes suivant chacune une loi du khi² et divisées par leur nombre de degrés de liberté (ddl). Il fallait la trouver, celle là…

On résume : pour une v.a \(X\) qui suit une loi du \(\chi^2\) à \(n_1\) ddl et une v.a \(Y\) qui suit une loi du \(\chi^2\) à \(n_2\) ddl...

\(\displaystyle{\frac{X/n_1}{Y/n_2} \leadsto F(n_1\,;n_2)}\)

En pratique, l'expression de la fonction de densité ne sert pas à grand chose mais elle est particulièrement décorative (il existe d'autres expressions équivalentes) :

\(F(n_1\,;n_2)(x)\) \(=\) \(\displaystyle{\frac{\Gamma\left(\frac{n_1 + n_2}{2} \right)}{\Gamma \left( \frac{n_2}{2}\right) \Gamma\left(\frac{n_1}{2}\right)}}\) \(\times\) \(\displaystyle{n_1^{\frac{n_1}{2}} n_2^{\frac{n_2}{2}}}\) \(\times\) \(\displaystyle{ \frac{x^{\frac{n_1}{2} - 1}}{(n_1x + n_2)^{\frac{n_1 + n_2}{2}}} }\)

Exemple de courbe représentative d'une densité de probabilité (réalisée sur Gretl) :

distribution de Fisher

La loi de Fisher-Snedecor est tabulée. Les tables sont d'ailleurs très copieuses...

 

Moments et mode

L’espérance ne dépend pas de \(n_1,\) ce qui peut sembler étonnant. Elle est égale à \(\displaystyle{\frac{n_2}{n_2 - 2}}.\)

La variance se calcule ainsi (là aussi, la formule est juste là pour faire joli, on n’en a guère besoin en pratique…) :

\({\rm{Var}}[F(n_1\,; n_2)]\) \(=\) \(\displaystyle{\frac{2n_2^2(n_1 + n_2 - 2)}{n_1(n_2 - 2)^2 (n_2 - 4)}}\)

On le voit, elle n'existe que si \(n_2\) est au moins égal à 5.

Le mode est égal à \(\displaystyle{\frac{n_1 - 2}{n_1} \times \frac{n_2}{n_2 + 2}}\)

 

Propriété

Restons encore un bref instant dans la théorie pour signaler que le carré d'un \(t\) de Student à \(n\) ddl suit une distribution du \(F(1\,;n).\)

 

Au fait, pourquoi ?

Vous vous demandez peut-être « à quoi peut bien servir un truc pareil ? »

Question légitime. Ce truc sert à tester si des variances sont égales car le numérateur et le dénominateur de \(F\) peuvent représenter deux variances. On a bâti sur cette distribution le test du \(F\) (ou test de Fisher-Snedecor), utilisé entre autres pour la comparaison de variances et, indirectement, dans le cadre de l’ANOVA.

 

extra-terrestres