Exemple d'AFC avec deux logiciels

AFC avec XLSTAT et Tanagra

Les données ci-dessous proviennent d’Eurostat et sont celles des productions par pays de bois de chauffage et de bois rond en 2006 (en milliers de m³ sans écorce). Le bois rond peut être de trituration (papier, agglomérés…) ou destiné à d’autres industries. Le bois de placage n’a pas été intégré pour ne pas surcharger l’exemple. Une deuxième variable est le type d’essence, feuillu ou résineux. Certaines cases du tableau sont vides et, entre le Luxembourg et les États-Unis, les pays enregistrent des productions fort différentes. Les données brutes du tableau seront utilisées.

 

Exemple

Nous souhaitons avoir une vision synthétique de la filière bois dans le monde grâce à une AFC. Nos informations sont résumées en une seule variable comprenant six modalités : ci-dessous, FC signifie Chauffage avec Feuillus, RA signifie Autres industries avec Résineux, etc. Comparons les restitutions de deux logiciels grâce à une sélection de quelques tableaux.

données

arbres

XLSTAT : le logiciel fournit le test d'indépendance du khi², les valeurs propres et pourcentages d’inertie ainsi que le graphique (ci-dessous).

résultats Xlstat

On retient trois axes qui résument \(89\%\) de l’inertie. À titre d’illustration, voici un extrait du tableau qui suit :

extrait

Puis viennent les coordonnées des lignes sur les axes factoriels, les mêmes mais standardisées, le poids relatif de chaque pays pour chacun des cinq axes et enfin les cosinus² des lignes. Seconde partie : mêmes tableaux mais pour les colonnes. Des représentations graphiques suivent.

Cos²

Tanagra : choix a priori de trois axes. Le \(\chi^2\) est suivi de l’histogramme des valeurs propres puis de l’analyse des lignes et des colonnes. Extrait :

Tanagra 1Tanagra 2

Le premier plan factoriel figure en page de représentation graphique des AFC.

 

Commentaires

Notons la bonne qualité de l’AFC. Indépendamment des observations sur les volumes, la distinction principale se trouve entre les pays nordiques, producteurs de résineux utilisés essentiellement pour la trituration, et les autres pays, peuplés de feuillus destinés au chauffage. Près de la moitié de la distinction se fait sur ce critère. Les coordonnées des différents pays sur cet axe sont donc très utiles pour se donner une idée rapide des positions respectives. Le second critère plus important est la spécialisation en feuillus de trituration. Il concerne par exemple le Portugal, très emblématique de cette production, ou le Canada, pays à fort volume de trituration (feuillus et résineux). Le troisième axe, qui n’explique que \(15\%\) des différences entre pays, indique que quelques uns produisent beaucoup de résineux hors trituration, comme l’Allemagne. Ainsi, les résineux « autres industries » et les résineux de chauffage, qui ne sont pas apparus pour expliquer les trois axes les plus explicatifs, auraient pu faire l’objet d’une seule variable sans grosse perte d’information.

Note : rappelons que le bois de placage étant exclu, ces conclusions ne valent que dans le cadre d’une illustration. Si vous êtes intéressé par la filière bois, ces chiffres et ceux qui n'ont pas été repris ici sont accessibles via le site de l'INSEE. À vous de jouer…

 

arbre