Les graphiques statistiques

Représentations graphiques

En présence de nombreuses données, le cerveau humain a beaucoup de mal à en dégager la configuration. C'est un peu comme dresser la carte d'une région rien qu'en la parcourant à pied, sans instrument de mesure. En revanche, avec une représentation visuelle, tout s'éclaire en une seconde !

Un graphique est une représentation de données statistiques. Et s’il existe plusieurs types de données, il y a aussi différents types de graphiques. Cette page ne fera pas de vous un(e) expert(e) en data visualisation mais elle vous en présente les principaux modèles.

Si votre travail vous conduit à en produire, vous apprendrez également à respecter quelques règles (voir aussi le lien en bas de page).

 

Diagrammes de répartition

  • Le diagramme circulaire, communément appelé « camembert », est à privilégier pour représenter des séries simples dont le caractère est qualitatif. Les parts du diagramme ont des aires qui sont proportionnelles aux effectifs de chaque modalité. Il est parfois représenté en trois dimensions (considéré comme plus esthétique dans le cadre de certaines publications) ou avec un secteur séparé des autres (lorsqu’on veut mettre une modalité particulière en exergue).

  • Le diagramme semi-circulaire est privilégié pour montrer la composition d’un parlement en fonction des groupes politiques.

  • L’histogramme permet de visualiser une série dont le caractère est continu. Il est formé de rectangles contigus dont les aires sont proportionnelles aux effectifs. On le construit à partir de classes de valeurs. Celles-ci peuvent avoir des amplitudes différentes, ce qui rend la réalisation de l’histogramme compliquée. D’ailleurs les logiciels qui permettent la construction automatique de tels graphiques sont rares et les représentations communément appelées « histogrammes » sont bien souvent de simples graphiques en barres élargies.

 

Diagrammes de comparaison

Le diagramme en barres (ou en bâtons) est une autre star des graphiques statistiques. C’est la longueur de chaque barre qui est proportionnelle aux effectifs ou aux pourcentages (malheureusement, il n’est pas rare de voir publiés des diagrammes dont la base des barres n’est pas au niveau 0).

Ce type de graphique est parfait lorsque le caractère est quantitatif discret mais il est également utilisé pour les caractères qualitatifs. Toutefois, dans la mesure où les barres se situent sur un axe, ce qui suppose une progression, il est préférable de réserver ce diagramme pour représenter un caractère quantitatif  (sauf éventuellement si le diagramme circulaire est illisible en raison de modalités trop nombreuses).

barres

Le cas échéant, il est possible de faire ce type de graphique en 3D pour intégrer un second caractère (illustration avec les tableaux de contingence).

 

Répartition et comparaison

Certains graphiques montrent à la fois une répartition et une comparaison.

  • Le diagramme à barres empilées résume plusieurs séries, les barres se trouvant les unes au-dessus des autres. Les empilements ont soit tous la même hauteur (pour montrer des répartitions en pourcentages), soit non (pour montrer les différences de valeurs). Les barres peuvent aussi être juxtaposées lorsque la lecture n'est pas plus difficile.

  • Le diagramme en anneau permet de montrer deux répartitions selon un critère qualitatif. Il permet d'éviter la représentation de deux camemberts côte à côte.

 

Évolutions

  • La courbe (ou graphique linéaire) est souvent utilisée mais, contrairement aux graphiques précédents, moins pour visualiser la façon dont se répartissent des modalités statistiques que pour représenter une évolution.

    Cette mal nommée n’est pas courbe puisqu’elle relie de façon rectiligne les points correspondant aux valeurs observées. Il est plus juste de parler de graphique en lignes. Elle indique des effectifs, des pourcentages, des fréquences, un indice ou n’importe quelle mesure. Mathématiquement, la courbe représente une fonction dont il n’existe bien souvent aucune expression algébrique (par exemple l’évolution du PIB). Pour certaines applications on estime qu’une courbe statistique peut être approximée grâce à une expression mathématique (par exemple la diffusion d’un nouveau produit) auquel cas elle est tracée de façon courbe. Sa construction ne fait pas obligatoirement croiser l’axe des abscisses avec le niveau 0 de l’axe vertical.

    Deux cas particuliers de courbes sont à signaler : la courbe avec indice 100 et le polygone cumulé croissant (ou éventuellement décroissant) des effectifs (e.c.c) ou des fréquences (f.c.c). Celui-ci ne représente pas une évolution mais la répartition d’une population, à l’instar des graphes répertoriés précédemment. Ce type de graphe permet une lecture directe des quantiles.

  • Le graphique en aire(s) est très proche. La surface située entre la courbe et l'axe des abscisses (ou entre deux courbes si cela a du sens) est colorée. L'axe des ordonnées commence oligatoirement à zéro. Exemple d'utilisation en page de suivi de la masse salariale et de construction en page d'aire avec Excel.

 

Autres

  • La boîte à moustaches, ou diagramme en boîte, présente une synthèse de la dispersion d’une série statistique. Pas très difficile à construire, elle est en revanche délicate à interpréter. L’intérêt de ce type de graphe est surtout de comparer entre elles plusieurs populations (ou échantillons).

  • Le nuage de points est idéal pour situer des individus en fonction de deux critères quantitatifs, matérialisés par deux axes. Il se peut donc que plusieurs points se situent les uns au-dessus des autres (ils ne représentent pas une fonction). On peut introduire une troisième dimension en remplaçant les points par des disques dont le diamètre est proportionnel à un troisième caractère (graphique en bulles ou bubble chart) et même de rajouter un troisième axe pour une visualisation dans l’espace afin de combiner quatre critères.

  • L'entonnoir montre une déperdition. L'application la plus connue est celle des entonnoirs (ou pipelines) de ventes : nombre de visiteurs sur un site marchand, puis nombre de clics, puis nombre de commandes...

  • Le radar se rencontre beaucoup en marketing et en psychologie. Il permet de situer plusieurs critères sur des échelles. Le graphique sémantique différentiel est très proche mais, étant plus difficile à lire, c'est plus un outil de travail que de présentation.

  • Les cartes thermiques intéressent la finance et surtout le marketing digital.

  • Les graphiques boursiers intègrent plusieurs informations. Alors qu'une simple courbe montre l'évolution des cours de clôture, les bâtonnets indiquent en plus les cours d'ouverture, de clôture, du plus haut et du plus bas. Les chandeliers japonais, ou bougies, sont des bâtonnets colorés en rouge ou en vert selon que le cours de clôture est inférieur ou supérieur au cours d'ouverture.

  • Les pyramides des âges sont des sortes de doubles histogrammes par tranches d'âge (hommes d'un côté, femmes de l'autre). Elles peuvent intégrer un caractère supplémentaire en se présentant sous forme de barres superposées (exemple : employés, agents de maîtrise et cadres).

Enfin, il n'est pas rare de rencontrer des graphiques mixtes, superposant par exemple une courbe et un diagramme en barres, pour montrer deux séries différentes dans un même repère. Cas particulier : une droite ou une courbe de régression traversant un nuage de points.

 

Liens

Pour un panorama plus large des diagrammes et sur l'importance d'une présentation soignée :

www.canva.com/fr_fr/decouvrir/10-facons-dutiliser-diagrammes

Quelques outils :

 

diagramme en secteurs