Fonction et ajustement logistique
La fonction logistique est particulièrement utile. Il ne s'agit pas d'évoquer l'indispensable fonction logistique de l’entreprise, alias supply chain, mais d’une fonction numérique qui permet, entre autres, une bonne modélisation de la diffusion de produits. Observons-là sous deux angles, l’un mathématique et l’autre statistique.
Un peu d’histoire pour commencer
La fonction logistique est parfois appelée « de Verhulst », du nom de son découvreur, mathématicien belge qui la baptisa « logistique » pour raisons inconnues, pendant la famine de 1845.
Selon le modèle de Verhulst, la croissance d’une population vérifie une équation différentielle de type \(y’ = ay(1 - y).\) En clair, il existe un plafond, contrairement au modèle de Malthus.
Un peu de maths pour continuer
La fonction logistique à trois paramètres est une composée de fonctions exponentielle, affine et inverse. Rien de moins.
Plus l’expression algébrique d’une fonction est complexe, plus il existe de façons de l’écrire. Aussi trouve-t-on notre fonction logistique sous plusieurs apparences. En voici une parmi d’autres…
\[f(x) = \frac{c}{{1 + b{e^{ - ax}}}}\]
Pour les cas qui nous intéressent, \(b\) est strictement positif. C’est à cette condition que la courbe représentative de la fonction présente une forme de S. Le réel \(a\) est strictement positif lui aussi. Le numérateur \(c\) est la limite de la fonction à l’infini (la courbe plafonne sous une asymptote horizontale) et est égal à 1 si l’on raisonne en pourcentage avec un plafond de \(100\%.\)
Cette fonction est continue, positive et dérivable sur \(\mathbb{R}\). La dérivée de la fonction logistique, strictement positive, n’est pas difficile à déterminer :
\[f'(x) = \frac{{cba{e^{ - ax}}}}{{{{\left( {1 + b{e^{ - ax}}} \right)}^2}}}\]
En page d'exercices de dérivation avec exponentielles, vous pouvez vous entraîner sur un cas faisant l'objet d'un exercice au bac S.
La fonction est symétrique par rapport à son point d’inflexion d’abscisse \(\frac{1}{a}\ln (b)\) et d’ordonnée \(\frac{c}{2}.\)
Un cas particulier est la fonction sigmoïde :
\[f(x) = \frac{1}{{1 + {e^{ - ax}}}}\]
Elle a le privilège d’être utilisée dans les réseaux de neurones.
Un peu de stats pour terminer
En marketing, on s’intéresse à la courbe représentative de la vie du produit. La fonction logistique modélise très bien cette configuration, à l’exception de la phase de déclin. Une autre courbe fréquemment testée est celle de Gompertz qui n’est pas symétrique. La courbe d’une fonction tangente hyperbolique présente quant à elle une forme de S symétrique mais elle est peu utilisée en économie.
La gageure consiste surtout à déterminer le paramètre \(c\), c’est-à-dire le niveau plafond qui signifie pour un produit la saturation de son marché.
Il est possible de vérifier si une liaison s’adapte à une fonction logistique.
Exemple : une société de vidéo surveillance commercialise des caméras à infra rouges cachées dans des nains de jardin. L’évolution des ventes annuelles se présente comme suit :
La régression sera réalisée par XLSTAT. On ne sélectionne pas « régression logistique » qui nous conduirait vers une modélisation logit hors de propos, mais « régression non linéaire ». La fonction logistique telle que décrite ci-dessus est celle à trois paramètres \((a, b, c).\) Cocher « pr3/(1+Exp(-pr1-pr2*X1)) ».
Votre sagacité vous a permis de relever une différence avec la formule indiquée plus haut.
En effet, si pr3 correspond bien à la valeur de saturation \(c\) et si pr2 n’est autre que \(a\), il n’en est pas de même de l’autre paramètre puisque la formule de XLSTAT fait intervenir l’exponentielle d’une fonction affine. Pour s’y retrouver, il faut considérer que pr1 = \(-\ln (b).\)
Ce détail étant observé, passons aux choses plus intéressantes. Le logiciel définit les trois paramètres de la courbe par itérations. Le résultat n’est pas mal du tout :
Les paramètres se dévoilent :
La qualité de l’ajustement est très bonne si l’on en juge par le \(R^2\), ce qui autorise des prévisions. On remarque que les ventes devraient plafonner à 4 325 nains de jardin.
Faisons une prévision pour la période 11 avec les deux formules (sous réserve des arrondis). Le nombre 348,813 est l’exponentielle de 5,855.
\[f(11) = \frac{{4324,799}}{{1 + {e^{[5,855 - (0,883 \times 11)]}}}}\]
\[ \Leftrightarrow f(11) = \frac{{4324,799}}{{1 + 348,813{e^{( - 0,883 \times 11)}}}}\]
\[ \Leftrightarrow f(11) \approx 4236\]
Note : si l’on pose comme hypothèse de départ un taux d’équipement plafonné à \(100\% \), il n’existe plus que deux paramètres à estimer. On peut alors poser \(Y = \ln \left( {\frac{y}{{1 - y}}} \right)\) et résoudre, par exemple avec un tableur, une régression linéaire simple du temps. L’ajustement devient \(Y = at + b .\) Puis on revient à la variable \(y\) avec un modèle de type \(y_i = \exp [-(at_i + b)].\)