Analyse des correspondances multiples

Analyse des Correspondances Multiples

Vous avez aimé l’AFC et ses énormes possibilités d’analyse ? Accrochez-vous, voici encore plus fort ! L’ACM !

Quelle utilité ?

L’analyse des correspondances multiples (ACM) est l'analyse factorielle à utiliser lorsqu’une population ou un échantillon est étudié à partir de trois variables qualitatives ou plus (puisque c’est l’analyse factorielle des correspondances (AFC) qui est appliquée lorsque deux variables seulement sont observées).

En entreprise, l’ACM est surtout un outil au service des études de marché, en particulier dans le traitement d’enquêtes dont les réponses sont d’ordre qualitatif (lorsque les questions n’appellent qu’une seule réponse parmi un choix prédéfini). Mais attention, toutes les modalités doivent être représentées de façon significative, comme nous le verrons. Il n'existe pas de règle précise mais la tentation peut exister de lancer une ACM sur quelques centaines d'unités statistiques seulement. Le risque est alors élevé d'avoir trop de modalités par rapport à l'effectif...

Le principe

Le principe consiste à conduire une AFC à partir d’un tableau disjonctif complet (individus ou autres unités statistiques en lignes, variables et modalités en colonnes) ou d’un tableau de Burt. Rappelons que celui-ci est une présentation de tous les tableaux de contingence des variables prises deux à deux et réunis en une seule matrice.

Ainsi, il est possible de déterminer des proximités entre des modalités de variables différentes ou entre individus pour en tirer des enseignements. Par exemple, un profil particulier de clientèle peut émerger à partir de divers critères observés.

Cette technique est une généralisation de l’AFC mais elle peut aussi être considérée comme une extension aux variables nominales de l’ACP sur individus et de l’ACP sur variables…

Ajoutons que l’ACM permet aussi d’analyser simultanément des variables qualitatives et numériques. Il suffit pour cela de décomposer ces dernières en classes. De simples graphiques descriptifs peuvent aider à choisir le découpage le plus judicieux. Par ailleurs, il est habituel d’intégrer des variables illustratives, c’est-à-dire non prises en compte dans les calculs mais situées par rapport aux autres dans les résultats.

Pour la procédure, peu de différences par rapport à une AFC dont le principe consiste à comparer le tableau des observations avec un tableau théorique de totale indépendance. Les écarts entre les deux sont mesurés avec la distance du khi². Une distinction entre ces deux techniques est que l’AFC se fonde sur des fréquences marginales alors que l’ACM est soit réalisée à partir d’un tableau disjonctif, soit à partir d’un tableau de Burt.

Rappelons que la distance du khi² est la somme des carrés des écarts entre des valeurs observées et théoriques, rapportés aux théoriques. Cette métrique a beaucoup inspiré les concepteurs de l’ACM…

\(\displaystyle{{d^2} = \sum\limits_{i = 1}^n {\frac{{{{\left( {{O_i} - {T_i}} \right)}^2}}}{{{T_i}}}}} \)

Les distances

Quelle distance sépare deux individus ?

distance

Reprenons la formule de la distance du khi² mais cette fois en l’adaptant aux écarts entre deux individus \(i\) et \(i'\) dans le cadre d’une ACM. Soit \(v\) le nombre de variables et \(n\) l’effectif. La somme des valeurs d’un tableau disjonctif complet est donc égale à \(nv\). Soit \(μ\) une modalité et \(m\) son poids.

\({d^2}\left( {i,i'} \right)\) \(=\) \(\displaystyle{\frac{1}{v}\sum\limits_{\mu = 1}^p {\frac{{{{\left( {{x_i} - {x_{i'}}} \right)}^2}}}{{\frac{m}{n}}}}} \)

Explication. Pour chaque modalité, on observe une distance entre deux individus (soit 1, soit 0 puisque le tableau ne comporte que des 0 et des 1). Cet écart est rapporté au poids de cette modalité par rapport à l’effectif. Donc, si le poids est élevé, la distance est faible. C’est logique : si pour telle variable tout le monde bénéficie du « 1 » alors tout le monde est proche. C’est aussi l’une des limites de la méthode car si presque personne ne présente telle modalité, alors ceux lui sont rattachés se situent à une distance considérable des autres. Ainsi, avant l’analyse, il faut veiller à ce qu’aucune modalité ne soit que très peu représentée car les distorsions que cette rareté entraîne risquent de masquer des distances plus faibles mais plus intéressantes car concernant un effectif plus nombreux…

La somme obtenue est rapportée au nombre de variables.

Il existe donc pour chaque modalité un nuage de points-individus dont le centre de gravité est \(\frac{m}{{nv}}\). Il est aussi possible de représenter un nuage de points-modalités global ou des sous-nuages de points-modalités par variables.

Toujours à partir d’un tableau disjonctif complet, voyons comment mesurer la distance qui sépare deux modalités \(μ\) et \(μ'\).

\({d^2}\left( {\mu ,\mu '} \right)\) \(=\) \(\displaystyle{{\sum\limits_{i = 1}^n {n\left( {\frac{{{x_{i\mu }}}}{m} - \frac{{{x_{i\mu '}}}}{{m'}}} \right)} ^2}}\)

On démontre qu’une modalité peu représentée impacte aussi l’inertie du nuage de points-modalités de façon exagérée.

Voyons maintenant quelles formules matricielles reviennent à appliquer ces mesures de distances.

Tableau de Burt et calculs matriciels

Le tableau de Burt indique les centres de gravité des individus par modalités. On nommera \(Z\) la matrice du tableau disjonctif, \(Z'\) sa transposée et \(D\) sa matrice diagonale.

La matrice du tableau de Burt est \(B=Z’Z\).

Les axes factoriels ont pour vecteurs directeurs les vecteurs propres de la matrice \(\frac{1}{v} \times B{D^{ - 1}}\).

Les valeurs propres ne sont pas comparables à celles d’une ACP car elles sont plus faibles. Par ailleurs, une valeur propre obtenue à partir d’un tableau de Burt est le carré de celle obtenue directement à partir d’un disjonctif complet.

Étude et interprétation

Voir l'exemple d’ACM.

ACM