Régression logarithmique et RLS avec calculatrice
Régression logarithmique : un intitulé un peu effrayant mais soyez sans crainte, la technique n'est pas compliquée.
Le cadre d'analyse
La recherche d’une liaison entre deux variables nous amène à représenter des observations sous la forme d'un nuage de points dans le plan (variable supposée explicative en abscisses et variable à expliquer en ordonnée). Ce nuage peut ou non montrer une forme. Si celle-ci est rectiligne, une régression linéaire simple (RLS) est envisageable. Formellement, c'est une fonction affine dont les paramètres sont déterminés grâce à la méthode des moindres carrés. On suppose alors que la liaison est linéaire. Si le nuage est courbé, vous devez faire preuve de physionomie et chercher dans vos souvenirs si sa forme évoque celle de la représentation d'une fonction déjà vue en cours de maths (courbe représentative d'une fonction du second degré, d'une exponentielle…) ou de marketing (courbe représentant une fonction logistique ou de Gompertz). La liaison n'est pas linéaire, mais à l'aide d'un changement de variable on peut parfois ramener notre étude à celle d'une RLS. C'est la technique qui sera employée ici (voir aussi la page sur l'ajustement non linéaire).
Parmi les fonctions de référence que vous avez déjà rencontrées figure la fonction logarithme. Contrairement à d’autres, elle est représentée par l’aspect rassurant d'une courbe qui ne s’emballe jamais.
L’approximation logarithmique est réalisable avec une calculatrice, un tableur ou un logiciel de statistiques.
L'exemple suivant est extrait d’un sujet de baccalauréat, en l’occurrence celui de la filière ES qui sévit à Pondichéry en avril 2010.
Partie A (énoncé)
Le tableau ci-dessous donne l'évolution, par période de cinq ans, de la population globale des deux Allemagnes (R.F.A. et R.D.A.) de 1958 à 1973.
Ces données sont représentées par le nuage de points ci-dessous:
L'allure de ce nuage suggère un ajustement affine.
1. Déterminer, en utilisant une calculatrice, une équation de la droite d'ajustement de \(y\) en \(x\) par la méthode des moindres carrés (les coefficients seront arrondis au centième).
2. En 1993, la population globale de l'Allemagne réunifiée s'élevait à 81 millions d'habitants. L'ajustement proposé est-il adapté?
Corrigé de la partie A
1- Une équation de la droite d'ajustement est \(y = 2,45x + 69,3.\) Cette question sert de support au mode d'emploi de calculatrices TI et Casio en page RLS avec calculatrices.
2- Le rang qui correspond à l'année 1993 est 8. Si dans l’équation on remplace \(x\) par 8 on trouve 88,9, soit près de \(10\%\) de plus que la réalité. La RLS s'avère donc inadaptée pour établir des prévisions correctes sur une aussi longue période.
Partie B et corrigé
On étudie ci-dessous l'évolution de la population de l'Allemagne sur une période plus étendue (à partir de 1990, il s'agit de la population de l'Allemagne réunifiée).
Ces données sont représentées par le nuage de points ci-dessous :
Au vu de l'allure du nuage, un ajustement logarithmique semble plus approprié. Pour cela on pose \(z_i = \exp^{(i/100)}\) pour \(1<i<11.\)
1. Recopier sur la copie et compléter la dernière ligne du tableau ci-dessous (les résultats seront arrondis au centième).
Le corrigé, en bleu, est obtenu par calculatrice soit en effectuant le calcul pour chaque valeur, soit de façon plus automatisée par l'introduction d'une variable L3 (mais attention aux arrondis). Cela étant, on peut s’étonner du choix d’un modèle logarithmique, c’est-à-dire avec limite tendant vers plus l’infini, pour prévoir la population de l’Allemagne pour qui une approximation avec asymptote horizontale à \(y = 0\) serait plus appropriée (taux de fécondité < 1,4)…
2. En déduire, en utilisant la calculatrice, une équation de la droite d'ajustement affine de \(z\) en \(x\), obtenue par la méthode des moindres carrés. On donnera la réponse sous la forme \(z = ax + b\), les coefficients \(a\) et \(b\) seront arrondis au centième.
3. En déduire que l'ajustement logarithmique recherché est donné par l'équation \(y = 100\ln (0,02x + 2,07).\)
4. À l'aide de ce nouvel ajustement, donner une estimation de la population de l'Allemagne en 2013.
2- La technique du changement de variable qui nous est imposée nous fait utiliser la fonction exponentielle. On exécute la même procédure que précédemment mais avec les données du second tableau. Soit \(z = 0,02x + 2,07.\)
3- Pour cette question, \(z\) est démis de ses fonctions malgré de bons et loyaux services pour être remplacé par son expression \(e^{y/100}.\) On retrouve alors le résultat donné dans l'énoncé.
4- Quant à la dernière question, elle nécessite de remplacer \(x\) par 12 (rang de l'année 2013). Soit \(y\) = 83,7 millions d’habitants. Toutefois, l'arrondi de l’exponentielle au centième du rang de l’année a un peu déformé la fonction de régression et donc les prévisions. Ainsi, un tableur ou une calculatrice qui traitent directement la régression logarithmique fournissent l’équation \(y = 4,648 \ln(x) + 71,626\), soit 83,176 si \(x = 12.\)
Un autre exemple d'ajustement logarithmique figure en page de date du point mort.