Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

Le tableau de contingence

logo

 

 

 

 

 

 

 

 

 

 

Tableaux de contingence sur Excel

Voici une page… reposante ! En effet, ici rien de difficile, pas de prise de tête… Un tableau de contingence est tout simplement un tableau dans lequel on situe un effectif selon deux critères (un en lignes et un en colonnes) qui sont découpés en modalités s’ils sont qualitatifs et en classes s’ils sont quantitatifs. Ces tableaux sont maintenant enseignés en classe de seconde (sans toujours être nommés ainsi) au chapitre des probabilités (Cf. pages initiation et exercices d'initiation aux probabilités).

Si une unité statistique se trouve dans deux cases du tableau simultanément, par exemple lorsqu'un répondant à une enquête peut donner plusieurs réponses à une même question, il ne s'agit pas d'un tableau de contingence.

Exemple de yaourts à boire vendus en une journée dans cinq points de vente au cours d’une campagne promotionnelle :

yaourts

Les effectifs sont parfois appelés nij, c’est-à-dire le nombre d’individus (ou de yaourts…) communs à la ligne i et à la colonne j. Leur répartition est appelée distribution conjointe.

Les totaux sont les distributions marginales. Ils se trouvent dans les MARGES du tableau. En d’autres termes, nous observons une distribution à une variable sur la dernière colonne et une autre sur la dernière ligne. Une fréquence marginale est donc un total rapporté à l'effectif total. La fréquence du parfum à la fraise est de 88 / 432.

Enfin, une ligne ou une colonne permet de connaître une distribution conditionnelle. La première colonne présente une distribution à CONDITION que les yaourts soient vendus à Nantes. L'effectif nij rapporté à un total de la ligne i ou de la colonne j est une fréquence conditionnelle. Même principe que pour déterminer une probabilité conditionnelle à partir d'un tableau...

L’utilité de cette présentation est de préparer une étude sur des liens éventuels entre modalités, sur le même principe qu’on vérifie si des évènements sont indépendants. Notamment, le test du khi² d’indépendance  et les mesures d’association s'établissent à partir de tableaux de contingence. Voir aussi un exemple en page exemple d'AFC. Toutefois, nous nous attacherons ici à la seule présentation du tableau. Un simple coup d’œil peut se révéler irremplaçable pour détecter ce qui doit l’être ou pour regrouper certaines modalités (dans des situations un peu moins simples que celle de l’exemple choisi…), étant entendu que les traitements statistiques risquent d’être inopérants si une case du tableau inclut moins de cinq unités.

Un moyen est d’utiliser les indices de spécificité, soit en lignes soit en colonnes. Il faut pour cela utiliser les fréquences conditionnelles :

fréquences

Ainsi, l’indice pour Nantes × ananas est de 0,18 0,19 = 0,97. Je reviendrai là-dessus un peu plus bas (voir aussi la page distribution bivariée). Voyons à présent quelques présentations de tableau permises par Excel 2007.

Dans le pavé « styles » de l’accueil, un clic sur « nuances de couleurs » et / ou « jeux d’icônes » permet de nombreuses présentations automatiques. En voici quelques unes.

tableaux Excel

Exemple d’un clic sur « barres de données » :

barres de données

On peut éditer un graphique appelé stéréogramme mais la plupart du temps, des informations sont masquées (passez par « remplissage uni » pour choisir les couleurs).

stéréogramme

Revenons aux indices de spécificité et appliquons-leur une petite teinture…

indices de spécificité

On voit immédiatement qui s’écarte le plus de l’indépendance (les cases les plus claires et les plus foncées).

 

impressionnisme

 

© JY Baudot - Droits d'auteur protégés