Un exemple de deux lissages

Lissages double et de Holt

En sciences humaines, une série chronologique non saisonnière montre habituellement des évolutions imprévues. Elle ne peut pas être parfaitement modélisée par une fonction mathématique qui permettrait une prévision facile. Toutefois, il existe des techniques de prévision à court terme relativement fiables qui amortissent les petites variations conjoncturelles en lissant la série. Celle-ci peut alors être prolongée sur l'avenir.

Problématique

L’inconvénient, c’est qu’il existe plusieurs techniques et que certaines d’entre elles peuvent produire des dizaines de prévisions différentes. En effet, elles fonctionnent avec des paramètres que le prévisionniste (ou son logiciel) peut choisir. Et ce choix n'est pas déterminé par une technique scientifiquement irréprochable ! Alors qui donnera la meilleure prévision ?

Ci-dessous nous avons testé trois techniques sur un exemple, la régression linéaire simple, bien connue, ainsi que deux techniques de lissage. Outils: Excel et XLSTAT.

Comme la série montre une tendance, le lissage exponentiel simple n’a pas été retenu. En revanche, le lissage exponentiel double (qui nécessite un seul paramètre) et le lissage de Holt-Winters (qui en nécessite deux) sont parfaitement adaptés pour prolonger une chronique non saisonnière avec tendance de long terme. Les paramètres des lissages ont été déterminés par le logiciel.

Données

La série choisie pour exemple est celle du nombre annuel de mariages en France métropolitaine entre 1974 et 2013. Dans un souci d’homogénéité sur la période, seuls les mariages entre sexes différents ont été retenus (source : INSEE).

Le challenge consiste à prolonger la série sur trois années. Les prévisions seront ensuite comparées aux données réellement observées sur 2014-2016. Bien sûr, les conclusions ne vaudront que sur cet exemple !

Les données sont les suivantes :

mariages

Analyse comparée

La régression linéaire simple (RLS) a l’avantage de fournir l’équation d’une fonction affine qui résume la tendance linéaire de la série. Avec les années entrées telles quelles (sans changement de variable), on obtient une équation de droite y =  -2 831,91+ 5 933 284.

Inutile de recourir à un logiciel dédié aux prévisions, Excel réalise ce travail en un clin d’œil (pour le mode d’emploi, voir la page RLS avec Excel).

Pour le lissage exponentiel double, XLSTAT a choisi un paramètre alpha proche de 1. L’initialisation est réalisée à partir de la première valeur.

stats

Le logiciel fournit des mesures permettant de juger la qualité de l’ajustement ( et indicateurs d'écarts).

double

Le lissage de Holt se fonde sur deux paramètres alpha et gamma (ici nommé bêta).

alpha 1,226 et beta 0,029

Le fait d’utiliser deux paramètres rend l’ajustement plus fin. Logiquement, la qualité est meilleure :

Holt

And the winner is…

 

RLS Lissage double Lissage de Holt Réalité
2014 229 826 226 719 228 873 235 315
2015 226 994 220 329 226 403 230 364
2016 224 162 213 938 223 933 226 614

évolution et prévisions

Il apparaît clairement que la RLS a donné les résultats les plus fiables. Mais la décision de commencer l’étude en 1974 (début de la décroissance du nombre de mariages) y est pour quelque chose ! Le lissage de Holt, quasi indépendant de cette date compte tenu de la durée de l’étude, a tout de même donné des prévisions très honnêtes !