Le mode et l'histogramme

Mode et représentations graphiques

La lecture de cette page ne nécessite pas d'énormes connaissances en statistiques...

 

Le mode

Le mode n'est pas la notion statistique la plus difficile à comprendre !

Il s'agit d'un paramètre de position qui caractérise une série statistique. Il est couramment utilisé en statistiques descriptives.

Le mode d’une série qualitative ou discrète est la modalité ou la valeur qui enregistre le plus grand effectif. Il peut y en avoir plusieurs.

mode

Pour analyser une série à caractère continu, on utilise des regroupements en classes. On observe alors une ou des classes modales. L'art de l'analyste consiste à déterminer en combien de classes il doit décomposer sa série. S'il n'y en a pas assez, les variations sont gommées et s'il y en a trop les tendances sont moins visibles. De plus, la classe modale risque d'être assez différente selon le choix qui a été fait.

Le graphique en barres ci-dessous montre clairement où est le mode. C’est la valeur L (réalisation avec Excel).

mode

C’est donc un indicateur de POSITION, comme d’ailleurs la médiane, la moyenne arithmétique ou d’autres moyennes… Mais il est le seul à pouvoir caractériser une variable qualitative.

Le mode d’une loi de probabilité est l’éventualité qui a la probabilité la plus élevée d’être réalisée.

Sur un graphique, il s’impose immédiatement à l’œil. Lorsque la série est continue, une présentation fallacieuse consiste à jouer sur des regroupements de modalités ou sur un choix habile de classes afin de faire émerger une classe modale plutôt qu'une autre. Une démarche honnête consiste à raisonner en densités (effectif d’une classe rapporté à l’étendue de celle-ci). Mais les classes extrêmes ont quelquefois des bornes un peu arbitraires…

Parfois, une distribution est bimodale (il existe deux modes). Dès lors, on ne peut plus parler de position centrale… Par ailleurs, la fonction =MODE d’Excel ne restitue qu’une valeur. Il est donc plus prudent d’observer un graphique.

distribution bimodale

Enfin, une distribution peut être plurimodale (ou multimodale) comme l'illustre le graphique en barres ci-dessous :

distribution plurimodale

 

L'histogramme

Excel utilise le terme inapproprié « d’histogramme » pour définir les graphiques en barres, réservant cette locution aux barres horizontales. En entreprise ou dans le langage courant, on emploie souvent le terme d’histogramme de façon impropre.

Histos, en grec, signifie le tissu. Gramme est ce qui est écrit. Un histogramme est une représentation écrite du tissu social. C'est Karl Pearson qui introduisit son emploi lors de conférences auprès de financiers de la City à la fin du dix-neuvième siècle.

Ce type de graphique est réalisé pour visualiser la distribution d’une variable continue. Les barres se touchent. Les valeurs de la variable sont placées de façon équidistante sur une échelle. Ce sont les aires des rectangles qui sont proportionnelles aux effectifs. Un histogramme ne comporte donc pas d'axe vertical gradué.

Par conséquent, sur un histogramme, le mode correspond à la surface la plus importante et non au rectangle le plus haut.

Pour construire ces différents types de graphique, on centre les valeurs au pied des barres ou des rectangles (comme ci-dessus) sauf si l’on représente une variable continue. Ce sont alors les extrémités de classe qu’on indique entre les rectangles de l’histogramme (comme ci-dessous).

histogramme

Lorsque les amplitudes de classes sont toujours les mêmes, l’histogramme n’est qu’un graphique en barres collées. Lorsqu’elles sont différentes, ça se corse. Pour une réalisation avec Excel, on doit nécessairement programmer (l’option « histogramme » de l’utilitaire d’analyse ne sert qu’à gagner du temps en évitant de construire un tableau croisé et non de gérer des différences d’amplitude de classes). Il faut alors modifier les données pour les traiter comme des densités puis considérer chaque valeur comme une série à part entière. Pour information, le graphique ci-dessus a été réalisé… par un logiciel de retouche photo (sinon, Géophar est un logiciel gratuit très simple d'utilisation pour réaliser ce genre d'exercice). Vous pouvez aussi tracer un histogramme avec un programme en Python.

Ces folles manipulations, ajoutées d'une part à l’aspect inesthétique de l'histogramme à amplitudes inégales et d'autre part à une interprétation inhabituelle font de cet outil un OVNI dans les salles de réunions. Il est dommage que les programmes scolaires abritent cet inutile instrument de torture qui risque d'engendrer le dégoût des statistiques plutôt que l'intérêt à transformer de banales données en informations riches d'enseignement.

Exemple d'exercice simple avec mode et histogramme : voir l'exercice avec moyenne...

 

barres