Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

La statistique de Durbin-Watson

logo

 

 

 

 

 

 

 

 

 

 

Statistique et test de Durbin-Watson (DW)

Tout petit déjà, vous souhaitiez savoir s’il existait une autocorrélation des résidus, notamment dans les modèles de prévisions. Eh bien en lisant cette page, vous saurez comment lever cette incertitude.

Notez qu’il ne s’agit que d’une autocorrélation d’ordre 1. Nous sommes dans la situation où vous avez établi un modèle (par exemple de régression multiple) et, le comparant à la réalité pour savoir si vous avez fait du bon travail, vous obtenez une série d’écarts. L’un des moyens de déterminer si le modèle est perfectible est de contrôler si deux écarts successifs se ressemblent. Voyons le comment et le pourquoi.

Le « comment » : soit votre logiciel favori vous restitue un graphique des résidus et vous remarquez que les points qu’ils représentent tracent une sorte de courbe, ce qui signifie qu’ils contiennent une information « oubliée » dans le modèle, soit vous établissez un test non paramétrique de Durbin-Watson afin de fonder votre opinion sur un chiffre et non sur une visualisation.

Le « pourquoi » : le modèle est peut-être mal choisi (régression linéaire simple au lieu d’une régression sur tendance exponentielle ou polynomiale, par exemple). Mais souvent, l’autocorrélation s’observe sur les résidus d’une modélisation de série chronologique. Et là, si le type de modèle est bien choisi, de deux choses l’une : d’abord, il peut exister une véritable autocorrélation entre les observations, par exemple en raison de comportements qui ne changent pas brusquement. Le modèle est presque bon, il suffit d’ajouter la variable expliquée de – 1 dans les explicatives de n. En revanche, si aucune autocorrélation n'a de raison d'être, il faut chercher d’autres variables candidates.

Maintenant que vous mourrez d’envie d’en savoir davantage sur ce fameux test de Durbin-Watson, voyons l’expression de cette statistique :

DW

Sa valeur est comprise entre 0 et 4. Une valeur proche de zéro indique une autocorrélation positive, les valeurs situées autour de 2 montrent une absence d’autocorrélation et si l’on s’approche de 4, il existe une autocorrélation négative (valeurs tantôt au-dessus et tantôt au-dessous de la tendance).

Pour une interprétation plus précise on se réfère à une table, à moins que le logiciel n’intègre un petit commentaire dans ses restitutions. On trouve rarement des tables qui donnent des valeurs en-deçà de quinze observations, les conclusions n’étant alors pas très significatives.

La table comprend, en fonction du nombre d’observations, deux limites entre lesquelles il y a un doute (d1 et d2, mais cette écriture n’est pas normalisée) :

limites du DW

En général, ces zones de doute sont considérées comme « probablement sans autocorrélation ».

Prenons l’exemple réel d’une régression simple (les conclusions seraient les mêmes si la régression était multiple). Il s’agit du nombre hebdomadaire de pages vues au cours des 15 premières semaines d’existence de ce merveilleux site qu’est www.jybaudot.fr (la première semaine étant incomplète, les observations commencent à 2 et se poursuivent jusqu’à 16). Source AwStats.

exemple

On devine que la corrélation linéaire n’est pas bonne. Les semaines 8 et 9 correspondent aux vacances de Noël. Les sorties ci-dessous sont celles du logiciel XLSTAT d'Adinsoft (extraits).

R²

paramètres

Le tableau ci-dessous n’a pas été recopié complètement (les intervalles de confiance ne sont pas repris pour une regrettable raison de mise en page) :

résidus et DW

Que faisons-nous de ce DW égal à 0,872 ? Posons les hypothèses du test.

H0 : il n’y a pas d’autocorrélation d’ordre 1 entre les résidus. H1 : il existe un processus autorégressif d’ordre 1.

extrait de la table

Le DW se situant entre 0 et 1,08, on rejette H0. Il se peut qu’il existe une autocorrélation positive d’ordre 1.

Voir aussi l'exemple de la page régression multiple avec tableur.

Ce test n’est pas celui qui emballe le plus les statisticiens. La zone de doute, surtout, ne lui donne pas une super crédibilité. Quand c’est possible, on a toujours intérêt à produire un corrélogramme pour compléter l'analyse d'autocorrélation.

 

autocorrélé

 

© JY Baudot - Droits d'auteur protégés