L'estimation empirique d'une tendance

Moyennes mobiles centrées

On vous transmet enfin le volume de commandes de nains de jardin du mois dernier. Comme cet article était très mal suivi, vous décidez d’éditer une courbe sur trois ans afin de savoir où se dirige la tendance. Et là, ô stupeur, il apparaît tellement de variations d’un mois sur l’autre que votre graphique est illisible. Mais où va-t-on ? Du calme. Lisez plutôt ceci.

 

Décomposition ?

Si l’on sait rattacher la tendance à une fonction connue (affine, exponentielle, logistique…), la série chronologique peut  être décomposée de façon analytique. C’est le domaine des régressions. Mais d’une part la saisonnalité peut être si forte qu’il faut d’abord l’ôter pour avoir une bonne vision de la tendance et d’autre part, les mouvements de fond observés ne sont pas toujours résumables par une fonction mathématique. De plus, toute tendance a la fâcheuse habitude de se retourner un jour ou l’autre. Cette page traite de l’autre méthode, dite empirique (d'ailleurs non contradictoire avec l'analytique, un lissage étant souvent une première étape avant le choix d'une courbe de tendance).

 

Lissage

Donc, vous êtes en présence d’une évolution qui, à première vue, ne se réfère à aucun modèle particulier. Vous allez utiliser les moyennes mobiles. Le but est de lisser la chronique afin qu'elle soit moins brouillée.

 

Technique

La technique consiste à rempacer une valeur brute par une moyenne arithmétique calculée entre la valeur observée et celles qui se situent autour.

Ces moyennes peuvent être de différentes longueurs. La longueur est un paramètre que vous choisissez en fonction de la taille de la chronique, de l’amplitude de ses variations, d’une saisonnalité et / ou d’un horizon de prévision. Si la longueur de la MM est choisie de façon à éliminer toute saisonnalité (par exemple longueur de 12 sur des données mensuelles), on parle de filtrage plutôt que de lissage.

Pour estimer une tendance, les MM doivent être centrées, c’est-à-dire qu’une valeur brute est lissée par la ou les valeurs qui suivent et le même nombre de valeurs qui précèdent. Précisons qu'il existe un autre type de moyenne mobile, non centrée, dont la finalité est très différente. Il s'agit des techniques de lissage exponentiel ainsi que de diverses variantes utilisées sur les cours de bourse (voir page moyennes mobiles unilatérales). Par ailleurs, une désaisonnalisation suppose un retraitement des coefficients saisonniers si la tendance est obtenue par moyenne mobile (voir la conservation des aires).

Donc, on ne lisse pas la dernière valeur observée, du moins dans la problématique qui nous préoccupe, mais une observation plus ancienne. Sinon, on obtient un fâcheux décalage, à l’image du graphique ci-dessous (vitesses d’émission sur eMule) : le lissage, en rose, n’est pas centré sur la courbe blanche des données observées.

Emissions eMule

Les choses sont simples lorsque la longueur est impaire. Si par exemple elle est de longueur \(k = 3,\) chaque valeur sera remplacée par la moyenne arithmétique entre elle-même, celle qui lui précède et celle qui lui suit :

Janvier 12  
Février 8 12
Mars 16 15
Avril 21 21
Mai 26 29
Juin 40  

C’est fort regrettable, mais la nouvelle série est forcément plus courte que l’initiale (on perd \(k - 1\) valeurs).

Manque de chance, on doit presque toujours retenir un nombre pair de valeurs pour un filtrage, par exemple 12 mois, 4 trimestres, etc. Le milieu de la période ne correspond alors pas à une date ou à une unité de temps telle que celle observée. Pour un lissage mensuel, on calcule alors la moyenne des douze valeurs de \(t - 6\) à \(t + 5,\) celle des douze valeurs de \(t - 5\) à \(t + 6\) et de faire la moyenne de ces deux moyennes. Autrement dit, pour passer d’une valeur brute à une valeur filtrée pour un mois donné, on lui applique une longueur de 11 (MM correctement centrée puisque 11 est impair) et on prend en compte pour moitié seulement chacune des deux valeurs qui encadrent cette longueur. Si l’on applique une MM de période 4 à la série ci-dessus, on obtient pour mars la valeur 16 (on retrouve ici la valeur brute mais c’est un hasard). Détail du calcul :

\(\displaystyle{\frac{\frac{12}{2} + 8 + 16 + 21 + \frac{26}{2}}{4}}\) \(=\) \(16\)

L’application de plusieurs filtrages successifs par MM (composition de moyennes) produit des moyennes mobiles pondérées (MMP).

Un exemple qui peut sembler être de l’acharnement thérapeutique est donné par la moyenne mobile de Spencer d’ordre 15 obtenue par applications successives des coefficients de MM : (\(\frac{1}{4},\) \(\frac{1}{4},\) \(\frac{1}{4},\) \(\frac{1}{4}\)) puis (\(\frac{1}{4},\) \(\frac{1}{4},\) \(\frac{1}{4},\) \(\frac{1}{4}\)) puis (\(\frac{1}{5},\) \(\frac{1}{3},\) \(\frac{1}{5},\) \(\frac{1}{3},\) \(\frac{1}{5}\)) puis (\(-\frac{3}{4},\) \(\frac{3}{4},\) \(1,\) \(\frac{3}{4},\) \(-\frac{3}{4}\)) (-¾, ¾, 1, ¾, -¾) ce qui équivaut à \(\frac{1}{320} \times (-3,\) \(-6,\) \(-5,\) \(3,\) \(21,\) \(46,\) \(67,\) \(74,\) \(67,\) \(46,\) \(21,\) \(3,\) \(-5,\) \(-6,\) \(-3).\) Ouf ! La moyenne de Spencer permet d’atténuer les effets saisonniers tout en respectant les cycles conjoncturels. Il existe également une moyenne de Spencer d’ordre 21 et les moyennes de Henderson, plus récentes (toutes sont disponibles sur Statgraphics Centurion avec possibilité de deux lissages successifs). D’autres MMP sont beaucoup plus simples : le « hanning » consiste à appliquer la MMP \(2 × 2,\) soit \((\frac{1}{4}, \frac{1}{2}, \frac{1}{4}).\)

Selon l’utilisation que vous en ferez et selon sa configuration, vous pouvez rattacher la série lissée à un type de courbe afin d’obtenir une modélisation simple permettant des prévisions (voir la décomposition analytique d’une tendance). Avec Excel, vous devez calculer une série de MM, éventuellement pondérées, sur une colonne spécifique afin de tracer la courbe lissée ; en effet, l’option de courbe de tendance « Moyenne mobile » ne produit pas de graphique avec des MM centrées car Excel présume que vous faites des extrapolations.

 

Illustration

Prenons l’exemple d’une série dont la saisonnalité est très forte. Il s’agit de la collecte de maïs en milliers de tonnes, en France entre 2001 et 2007 (en bleu, source INSEE). La courbe verte est celle de la moyenne mobile 12 mois. La désaisonnalisation par MM est certainement la meilleure technique pour avoir une vision claire du passé (graphique Excel).

Collecte de maïs

maïs

 

Améliorations

Par ailleurs, en cas de valeurs aberrantes, un lissage par succession de médianes mobiles d’ordre 3 peut être préféré aux MM (G. Mélard, « Méhodes de prévision à court terme », Ellipses 2007 p. 99).

Enfin, certains procèdent à une régression linéaire simple à partir de la série filtrée par MM.

 

Himalaya-Beauce