Le tableau de contingence

Tableaux de contingence avec Excel

Voici une page… reposante ! En effet, ici rien de difficile, pas de prise de tête… Nous vous présentons le tableau à double entrée dans sa version la plus simple et même la façon de faire ressortir certaines informations (utile s'il fait partie d'un tableau de bord !)

 

Présentation

Un tableau de contingence est tout simplement un tableau dans lequel on situe un effectif selon deux critères (un en lignes et un en colonnes) qui sont découpés en modalités s’ils sont qualitatifs et en classes s’ils sont quantitatifs. Ces tableaux sont maintenant enseignés en classe de seconde (sans toujours être nommés ainsi) au chapitre sur les probabilités (Cf. la page d'initiation aux probabilités) et en premières technologiques (voir les statistiques à deux variables et l'exercice sur les fréquences).

Si une unité statistique se trouve dans deux cases du tableau simultanément, par exemple lorsqu'un répondant à une enquête peut donner plusieurs réponses à une même question, il ne s'agit pas d'un tableau de contingence.

Exemple de yaourts à boire vendus en une journée dans cinq magasins au cours d’une campagne promotionnelle :

effectifs

On formalise parfois les effectifs par \(n_{ij},\) c’est-à-dire le nombre d’individus (ou de yaourts…) communs à la ligne \(i\) et à la colonne \(j.\) Leur répartition est appelée distribution conjointe.

Les totaux sont les distributions marginales. Ils se trouvent dans ce qu'on appelle les marges du tableau. En d’autres termes, nous observons une distribution à une variable sur la dernière colonne et une autre sur la dernière ligne. Une fréquence marginale est donc un total rapporté à l'effectif total. La fréquence du parfum à la fraise est de \(\frac{88}{432}.\)

Enfin, une ligne ou une colonne permet de connaître une distribution conditionnelle. La première colonne présente une distribution à CONDITION que les yaourts soient vendus à Nantes. L'effectif \(n_{ij}\) rapporté à un total de la ligne \(i\) ou de la colonne \(j\) est une fréquence conditionnelle. Même principe que pour déterminer une probabilité conditionnelle à partir d'un tableau...

Petit apparté technique : pour l'analyste, l’utilité de cette présentation est de préparer une étude sur des liens éventuels entre modalités, sur le même principe qu’on vérifie si des évènements sont indépendants. Notamment, le test du khi² d’indépendance  et les mesures d’association s'établissent à partir de tableaux de contingence. Voir aussi l'exemple d'AFC. Mais ici nous nous contenterons de la seule visualisation du tableau. Un simple coup d’œil peut se révéler irremplaçable pour détecter ce qui doit l’être ou pour regrouper certaines modalités (dans des situations un peu moins simples que celle de l’exemple choisi…), étant entendu que les traitements statistiques risquent d’être inopérants si une case du tableau inclut moins de cinq unités.

yaourts

 

Traitements

Un moyen est d’utiliser les indices de spécificité, soit en lignes soit en colonnes. Il faut pour cela utiliser les fréquences conditionnelles :

fréquences conditionnelles

Ainsi, l’indice pour Nantes × ananas est de \(\frac{0,18}{0,19} = 0,97.\) Nous reviendrons là-dessus un peu plus bas (voir aussi la page sur la distribution bivariée). Présentons à présent quelques possibilités permises par Excel. Vous trouverez le mode d'emploi en page de mise en forme conditionnelle des tableaux.

tableaux Excel

Exemple d’un clic sur barres de données :

barres de données

On peut également éditer un graphique appelé stéréogramme. À utiliser avec précaution car la plupart du temps des informations sont masquées.

stéréogramme

Revenons aux indices de spécificité et appliquons-leur une petite teinture pour obtenir une carte thermique.

indices de spécificité

On voit immédiatement qui s’écarte le plus de l’indépendance (les cases les plus claires et les plus foncées).

 

impressionnisme