mèche perceuse

 

 

 

 

 

 

 

 

 Médiane et médiale

Il ne sera pas question ici des médianes qui partent de l'angle d'un triangle pour terminer leur course au beau milieu du côté opposé et dont le point de rencontre est le centre de gravité. Non, cette médiane-là est statistique et n'a pas grand chose à voir avec son homonyme géométrique...

Posons le décor : on observe une distribution à une variable. Cette variable statistique est quantitative.

La médiane correspond au deuxième quartile : si l’on trie les données par ordre croissant (ou décroissant, d’ailleurs), il s'agit de la valeur prise par l’observation du milieu (ou à la moyenne des deux valeurs du milieu si le nombre d’observations est pair).

Comme la moyenne, la médiane est un indicateur de position centrale mais beaucoup plus robuste aux erreurs et aux valeurs bizarres. A titre d’exemple, on s’intéresse rarement à la rémunération moyenne d’un effectif hétérogène puisque quelques revenus très élevés vont « tirer » cet estimateur vers le haut. La rémunération médiane est beaucoup plus pertinente. En entreprise, la médiane est suivie telle quelle comme indicateur de nombreux tableaux de bord.

Si la variable est discrète, par exemple une note sur 10, la médiane est une valeur observée tandis que la moyenne a de bonnes chances d'être un nombre avec des décimales. La notion de médiane est donc plus concrète que celle de moyenne.

Un minimum de bon sens est tout de même attendu du lecteur : on ne s’intéresse pas à la médiane d’une variable quantitative discrète si elle présente trop souvent une ou deux valeurs. Prenons l’exemple de la progéniture des espèces animales. Le nombre médian observé chez les chiennes n’a pas grand intérêt si bon nombre d’entre elles n’ont jamais procréé. Le mode peut en revanche être utilisé. En revanche, pour les espèces sauvages, la médiane signifie quelque chose.

Lorsqu'on a à faire à des classes de valeurs, soit on utilise la notion de classe médiane, soit on détermine la médiane par interpolation linéaire.

La médiane est aussi le paramètre-clé lorsque les valeurs sont ordinales. Ce type de variable est très fréquent dans les études marketing. Mais si les numéros d'ordre sont regroupés en classes, il est ici impossible de retenir une médiane unique. On recherche forcément une classe médiane.

La médiane est également utilisée dans plusieurs méthodes de data mining bien qu’elle se prête beaucoup moins bien que la moyenne aux développements mathématiques et aux algorithmes de calcul des ordinateurs.

Sur Excel, on utilise soit la fonction MEDIANE(données), soit la fonction QUARTILE(données;2).

Enfin, on utilise dans quelques cas rares la médiane pondérée (par exemple pour certains indices des prix qui cherchent à minimiser les valeurs aberrantes). Les observations sont a priori affectées de poids. On classe ces observations par ordre croissant mais au lieu de retenir celle qui sépare l’effectif en deux parties égales, on retient celle qui partage la masse des poids en deux (en l’occurrence, chaque article ayant une pondération différente dans le panier du consommateur, on retient comme médiane la variation de prix de l’article qui se situe à 50 % du volume du panier).

L'écart médian est la médiane des écarts (en valeur absolue) par rapport à la moyenne ou à la médiane.

La médiale

Beaucoup moins utilisée que la médiane, elle trouve son utilité lorsqu’un montant global, par exemple une masse salariale, est partagé par un effectif. On s’intéresse cette fois-ci à la valeur médiane de la distribution de la variable et non de l’effectif. Graphiquement, elle correspond à l’ordonnée 0,5 d’une courbe de Lorentz. C’est par exemple la rémunération du salarié qui permet d’atteindre la moitié de la masse salariale.

Exemple : voici les rémunérations de 17 individus. Ceux-ci sont classés par ordre de croissant de salaire.

médiane et médiale

Le salaire médian est celui du 17ème individu, en l’occurrence M. Chat : 1 600. Si l’on coupe la masse des salaires en deux, c’est-à-dire à 17 170, on constate que la médiale se trouve quant à elle entre MM Daim et Cheval (soit environ 2 000, par interpolation). Pour sa part, le salaire moyen s’établit à 2 020.

Tests

La qualité de robustesse de la médiane et son importance sur les données ordinales font que ce paramètre est utilisé dans le cadre de certains tests comparatifs (et notamment le test de la médiane).

 

plus de livres (France)    plus de livres (Canada)