Les ajustements non linéaires

Initiation à la régression non linéaire

L’ajustement linéaire entre deux variables est une opération courante dans bon nombre de domaines qui s’appuient sur les séries statistiques. Visuellement, on dispose d’un nuage de points qui représentent des observations puis on calcule l’équation d’une droite (dite des moindres carrés) qui suit la forme du nuage (si bien sûr les points sont à peu près alignés). Cette technique permet de réaliser des interpolations et surtout des extrapolations.

Toutefois, le nuage n’a pas souvent une forme rectiligne. S’il ressemble à une banane, il sera mal résumé par une droite. D’où l’intérêt de savoir procéder à des ajustements non linéaires.

Cette page s’inscrit dans le programme de maths de terminale technologique et dans celui de maths complémentaires de terminale générale mais elle peut bien sûr apporter des informations à tous, y compris aux étudiants et aux professionnels…

 

Différentes configurations

Si vous lisez cette page, vous avez déjà un certain bagage mathématique. Félicitations. Vous avez donc une idée de l’aspect de certaines courbes représentatives de fonctions (des paraboles, par exemple).

Non seulement vous devez connaître ces configurations, mais vous devez aussi connaître les opérations réciproques des fonctions que vous allez utiliser : la fonction carré et la fonction racine carrée, la fonction logarithme décimal et la fonction exponentielle de base 10 (terminale technologique) ou encore la fonction logarithme népérien et la fonction exponentielle de base e (terminale générale).

Il n’est pas toujours facile de trouver dans notre boîte à outils mathématiques la courbe qui s’applique au mieux à la forme du nuage de points. Par exemple un ajustement polynomial ressemble beaucoup à un ajustement exponentiel. C’est pourquoi il est recommandé de procéder à un changement de variable qui transforme la configuration du nuage en alignement. Là, on voit tout de suite si les points sont convenablement alignés ou s’ils se dispersent d'une autre façon.

Voici un exemple de configuration, réalisé avec GeoGebra.

Vous disposez d’un nuage qui montre une croissance d’abord rapide puis de plus en plus faible.

nuage
Comment trouver la bonne approximation ? Ci-dessous, nous avons ajouté une courbe qui représente une évolution en racine carrée (au-dessus, en vert) et une autre qui représente une fonction logarithme (en bleu). Le choix n’est pas facile. Au lycée, l’énoncé guide heureusement le choix, mais dans la vie professionnelle, on peut hésiter ! D’autant que si les observations représentent des séries temporelles et qu’il faut les extrapoler sur le long terme, les prévisions seront très différentes !

ajustements

C’est ici que le changement de variable intervient. Et là, au cas où il serait encore difficile de choisir de visu, il existe des outils pour savoir quel est le meilleur ajustement (coefficient de corrélation…).

Si l’on élève les valeurs des points au carré, on remarque un bon alignement presque partout. Donc une fonction racine carrée semble être un bon choix pour ajuster le nuage de points.

nuage

Si l’on utilise les exponentielles des valeurs, on obtient un nuage un peu plus courbe. Par conséquent, l’ajustement logarithmique semble un peu moins bon que l’ajustement par racine carrée.

nuage

 

Exercice

Soit les données suivantes :

Période 1 2 3 4 5
Observations \(t_i\) 21 9,5 7 4,9 4
  • Représenter le nuage de points.
  • Comme ce nuage fait penser à une hyperbole (fonction inverse), on décide de l’approximer par une courbe d’équation \(y = \frac{20}{x}.\) Valider ce choix par un changement de variable approprié.
  • On suppose que l’ajustement est bon. Déterminer une prévision pour \(t=8.\)

 

Corrigé

Nuage de points (réalisé avec Excel)

nuage

L’opération réciproque de la fonction inverse est… elle-même. Donc on étudie les inverses des observations. Elles apparaissent dans le tableau suivant (dernière colonne).

inverses des observations

D’où un très bel alignement. Nous avons demandé à Excel de tracer la droite d’ajustement, ainsi que son équation et le \(R^2\) (carré du coefficient de corrélation, pour ceux qui connaissent…)

ajustement Excel

La prévision pour la période 8 est \(t_8 = \frac{20}{8} = 2,5.\)