Régression sur fonction du second degré
Derrière ce titre légèrement pompeux de « tendance quadratique » se cache un bon vieux souvenir. Non pas la madeleine de Proust, qui a plutôt l’allure d’une loi normale, mais les fonctions du second degré apprises au lycée.
Dans quelle circonstance ?
Supposons qu'une parabole, ou plutôt une partie de celle-ci, reflète le meilleur ajustement d’un nuage de points représentatifs d’observations. Le coefficient de corrélation linéaire sera misérable (et même nul si l’ajustement est parfait) alors qu’il existe une liaison : cette dernière n’est pas linéaire mais quadratique.
Les nuages de points qui supposent ce type de régression ne ressemblent pas forcément à une parabole (voir exemple ci-dessous). D'ailleurs, si un tel nuage montre une corrélation quadratique parfaite mais que les observations se situent loin de l'extremum, une régression linéaire simple peut faire l'affaire car l'approximation affine est correcte sur un intervalle assez grand. En revanche, aux environs de l'extremum, on ne peut pas se permettre de se tromper de modèle.
Pour obtenir l’expression de la fonction, il faut soit disposer d’un logiciel qui la calcule (Excel autorise cette possibilité), soit considérer qu’il s’agit d’une régression linéaire multiple avec comme variables explicatives \(x\) et \(x^2.\)
Exemple
Avec Excel :
Soit une série chronologique non saisonnière.
On trace un nuage de points (ci-dessous). Il n’est pas linéaire mais pas non plus incurvé au point d’être résumé par une courbe exponentielle. En l’occurrence, un ajustement polynomial d’ordre 2 est quasi parfait.
Sur XLSTAT :
Outre l’observation visuelle, le choix du modèle le plus adéquat se fait sur la base des \(R^2\) des indicateurs d’écart, de l’AIC et du BIC.
XLSTAT permet une telle comparaison. Le tableau ci-dessous illustre notre exemple (la colonne « Equation », beaucoup trop large, a été tronquée). Le critère de la somme des carrés des résidus montre que si notre modèle est très bon (surligné en vert), d’autres types de corrélation sont encore meilleurs…
Sur calculatrice :
Une calculatrice autorisée au bac permet d'obtenir l'équation de la fonction quadratique. Sur la TI-83, tapez sur la touche STAT puis positionnez-vous sur EDIT dans le menu, choix 1. Entrez les valeurs.
Ensuite, touche STAT puis menu CALC. Allez sur le choix n° 5, QuadReg. ENTER. Vous retrouvez les paramètres qui apparaissent sur le graphe d'Excel :
QuadReg
y=ax²+bx+c
a=1.992857143
b=.7023809524
c=4.171428571
Mais encore...
Ce type d'ajustement non linéaire est assez courant, que \(a\) soit positif (courbe convexe) ou négatif (courbe concave).
Par exemple, en marketing, une corrélation en U inversé s'observe quand on détermine le temps que passent les clients à chercher de l'information avant un achat important, en fonction de leur niveau croissant d'expertise (établi par exemple à partir d'échelles de Likert) : ceux qui achètent sans être intéressés ne veulent pas perdre de temps et les experts estiment en savoir suffisamment. Les consommateurs qui ont des connaissances moyennes sont ceux qui prennent le temps de comparer.
Note : un exemple d'ajustement par une fonction polynomiale de degré 3 figure en page marge sur coûts variables.