Décomposition d'une chronique : la tendance
La tendance (trend) est souvent la première chose à détecter lors de l'analyse d'une série temporelle (voir page interprétation d'une série chronologique) Si vous travaillez dans la mode, sachez que cette « tendance » est à l’opposé de celles que vous connaissez puisqu’il s’agit d’un phénomène qui dure.
Présentation
La tendance est l'orientation générale d'une série de valeurs observées à la hausse ou à la baisse sur une période assez longue. Lorsqu'il n'existe pas d'orientation, on dit qu'il n'y a pas de tendance, ce qui ne signifie évidemment pas que toutes les valeurs sont les mêmes...
Rappelons une règle de base pour l’étude de séries temporelles économiques. C'est la décomposition analytique : chronique = tendance + variations périodiques + variations résiduelles aléatoires (+ cycle économique éventuel). Celle-ci suppose une certaine régularité. En entreprise, c’est souvent une évolution de volumes observée dans la durée. Nous n'évoquerons pas ici le cas particulier des tendances boursières, étudiées dans le cadre de l'analyse technique et sur lesquelles se greffent des mouvements statistiquement imprévisibles...
Technique
La page que vous avez la chance d’avoir sous les yeux étudie la composante « tendance » dans les cas où celle-ci est estimée par une fonction \(f(t),\) avec une unité de mesure temporelle \(t = 1, 2, 3…\) Comme on suppose que la série est fonction du temps, nous sommes dans le champ d'un modèle déterministe. Une tendance peut aussi être estimée par des moyennes mobiles (MM), qui ne donnent pas lieu à une expression algébrique mais à une série de valeurs filtrées à partir de laquelle \(f\) est déterminée (voir l'exercice du DCG en page exemples de prévisions de ventes saisonnières). En tout état de cause, le filtre des MM est fonction de la durée d'une période (c'est l'ordre de la MM) et non de l'intégralité de la chronique. Par conséquent, les MM ne permettent pas d'obtenir une tendance pure, celle-ci étant mélangée à une composante cyclique.
La méthode analytique d’estimation de tendance repose sur des fondements théoriques mais aussi sur des choix : détermination a priori du modèle de tendance (fonction linéaire ou exponentielle du temps, par exemple) et d’un schéma de décomposition additif ou multiplicatif qui permet d'isoler au mieux la composante saisonnière. Il existe bien sûr des moyens d’évaluer la qualité du modèle obtenu.
L’avantage de résumer une tendance par une équation est toutefois évident : les prévisions sont assez faciles à établir, et pas seulement en \(t + 1.\)
La première étape consiste donc à détecter si une tendance existe. Après observation visuelle du graphique, il est recommandé de tester les moyennes annuelles (ou autre période englobant d'éventuels mouvements saisonniers), par exemple avec une ANOVA. Attention, ce test n'est pas obligatoirement fiable (l'hypothèse H0 sera rejetée en cas d'année exceptionnelle au milieu d'une tendance plate).
Ensuite, certains logiciels permettent le choix du type de la fonction \(f\) de tendance. Dans la mesure où ces derniers vous restituent également les coefficients de corrélation, où vous visualisez la courbe des valeurs observées, et surtout dans la mesure où vous connaissez le sujet que vous traitez, vous pouvez ne pas être d’accord avec ce choix et en privilégier un autre.
Ne cherchons pas l'originalité : commençons par le plus simple (on se place dans le cadre d’une analyse sur plusieurs années).
Hypothèse : on suppose la tendance linéaire. Elle est alors formalisée par la droite de régression linéaire entre l’unité de mesure du temps \(t\) (avec \(t = 1, 2, 3…\)) et \(y\) (ventes, appels, achats…). Le coefficient de corrélation est peut-être tout petit mais c’est normal si les fluctuations saisonnières sont importantes (illustration en bas de page). C’est l'une des raisons pour laquelle les prévisionnistes procèdent à la régression sur moyennes annuelles ou sur la série filtrée par moyennes mobiles.
A peine moins facile, on SAIT qu’il existe une croissance à taux constant. Avec Excel, et sous réserve de données positives, soit vous créez une colonne des logarithmes de \(y\) (fonction LN pour Excel) soit vous travaillez directement sur la fonction exponentielle (voir exemple la page régression sur tendance exponentielle).
D’une façon générale, si vous cherchez juste à rattacher une tendance brouillée par de nombreux mouvements à un type de fonction connue, vous pouvez facilement le faire avec Excel, qui calcule des tendances affines, exponentielles, logarithmiques, polynomiales (degré 2 à 6) et puissance : clic droit sur la courbe puis Options de courbe de tendance. Sur un logiciel plus évolué en traitements statistiques, vous bénéficiez de plus d’options, d’intervalles de confiance et d’intervalles de prévision.
Enfin, en cas de valeurs aberrantes, il peut être judicieux de les calculer à partir des médianes annuelles (mais la désaisonnalisation nécessitera une petite correction) ou d'employer la méthode de Theil.
Exemple
La courbe ci-dessous montre l’évolution du fret aérien des ADP (Aéroports de Paris) entre janvier 82 et décembre 2007 (en millier de tonnes, source INSEE). Elle illustre bien les limites d’un ajustement de la tendance par une fonction. Alors que le trend semblait linéaire depuis 10 ans, celui-ci s’est modifié et apparaît maintenant comme une évolution exponentielle (courbe rouge)… jusqu’au jour où ce modèle sera à son tour invalidé !
Les données ci-dessous sont celles de l’indice INSEE de la production industrielle – produits de la construction automobile. La saisonnalité est forte et l'on observe une valeur aberrante (c'est la dernière ; mais disposant d'une série de 72 valeurs, nous considèrons qu'elle n'est pas perturbatrice et nous la maintenons).
Si l’on résume cette évolution par une droite établie sur l’ensemble des valeurs, on obtient un \(R^2\) \(= 0,3074\) (courbe en rouge). Calculé sur les six moyennes annuelles, il est évidemment beaucoup plus élevé (0,9931). Calculé sur les six médianes, \(R^2 = …1\) ( !).