La régression multiple sur tableur

Quelques résultats d'une RLM avec XLSTAT

Nul besoin de dépenser une fortune pour réaliser des régressions linéaires multiples (RLM), il existe des logiciels libres pour cela. Nul besoin non plus de se lancer dans des programmations compliquées, l’add-in d’Excel XLSTAT (produit d’Addinsoft) est d’une utilisation particulièrement simple. Certes, le logiciel complet est payant mais vous pouvez télécharger une version d’essai et, même si vous ne l’achetez pas, vous bénéficiez de la version gratuite en fin de période d’essai. Pourquoi s’en priver ? C’est avec celle-ci que l’analyse qui suit a été réalisée. Malgré la gratuité du produit, les informations fournies sont nombreuses et toutes n’ont pas été reproduites ci-dessous.

 

Les données

La variable à expliquer est \(Y\) et les quatre variables explicatives sont des coordonnées sur des axes factoriels, établies à partir d’une ACP. Bon, ce n’est pas un exemple très concret mais nous cherchons juste à étudier quelques sorties du logiciel alors qu'importe la signification des chiffres.

F1 F2 F3 F4 Y
0,5 1,2 -0,4 0,9 45
1,3 2,4 -0,5 0,5 52
0,6 1 -0,4 -0,1 45
3 0,4 -0,7 0 74
0,3 0 -0,4 -0,6 42
0,2 0 -0,4 -0,7 41
0,2 -4 1,3 -2,1 13
-1,2 -3,5 -0,2 2,6 25
-1 -3,2 -0,2 3,1 24
-1,3 -1 -0,2 -0,4 28
3,1 3 -0,7 -0,3 68
-3,2 -2,8 2 -2,1 5
3,1 2 -0,7 -0,4 74
1,2 2 -0,5 -2,1 52
1,5 1,4 -2 -1 54
0,4 0,6 0,4 0,2 46
-0,1 -4 0 0,3 19
-2 -1,6 -0,2 0,5 20
0,7 0,7 -0,4 0,4 47
2,9 4 -3 0,6 80
0,1 0 -0,4 0,6 41
-3 -3,1 4 3 9
0,5 1 -0,4 -4 45

Pour procéder à l’analyse cliquez dans le ruban d'Excel, soit sur l’onglet XLSTAT free soit sur Compléments. Choisissez Régression linéaire dans la barre d’outils. Une boîte de menu s’affiche. Vous pouvez choisir quelques options. Ici, seules celles qui sont proposées par défaut ont été retenues. Les plages de valeurs ont été sélectionnées avec les intitulés des variables.

 

Les sorties

Le premier tableau obtenu est, comme c’est souvent le cas dans les analyses, celui des statistiques descriptives.

Statistiques descriptives

L’écart-type correspond à la fonction ECARTYPE d’Excel (sans biais).

Le second tableau est la matrice de corrélation.

Matrice de corrélation

Le troisième est essentiel puisqu’il fournit les statistiques de la régression : coefficient de détermination et \(R^2\) ajusté, moyenne des carrés des erreurs (MCE) puis sa racine carrée, MAPE (Mean Absolute Percentage Error), coefficient de Durbin-Watson, coefficient \(Cp\) de Mallows, AIC, SBC (critère bayésien de Schwarz) et critère de prédiction d’Amemiya.

Régression

Le quatrième tableau est celui d’analyse de la variance.

ANOVA

Le dernier qui sera reproduit ici est celui des paramètres du modèle. La colonne valeur permet d’écrire l’équation du modèle, c’est-à-dire :

\[Y = 6,955\,F1 + {...} + 39,424.\]

paramètres

D’autres tableaux sont fournis par XLSTAT (coefficients normalisés, prédictions et résidus…) ainsi que des graphes (résidus normalisés…).