Une étude de temps d'arrivée

Tests d'adéquation à un processus de Poisson

Lorsqu’un même évènement survient successivement de façon aléatoire et relativement rare, nous sommes en présence d’un processus de Poisson. Réciproquement, le fait de tester un processus afin d’estimer son caractère poissonien permet de valider ou non l’hypothèse selon laquelle les évènements surviennent de façon aléatoire. Illustrons-le avec deux exemples.

Problématique

On a relevé les dates auxquelles une machine est tombée en panne sur une période de cinq ans. En principe, les pannes ne devraient être liées qu’aux circuits électroniques dont la durée de vie obéit à une loi exponentielle (sans vieillissement). Mais il semblerait qu’elles soient devenues plus nombreuses. Est-ce un simple effet du hasard ? Si oui, nous sommes en présence d’un processus de Poisson.

Il existe deux techniques pour tester si le processus est poissonien : vérifier si le nombre de pannes survenant au cours d’une période obéit à une loi de Poisson ou vérifier si les durées qui séparent deux pannes suivent une loi exponentielle. C’est cette seconde option qui a été choisie.

Données

Les dates auxquelles sont apparues des pannes entre début 2013 et fin 2017 sont les suivantes :

pannes
03/01/2013
14/09/2013
08/12/2013
07/06/2014
22/10/2014
06/03/2015
30/01/2016
15/04/2016
09/11/2016
02/08/2017
09/09/2017
30/09/2017
20/10/2017
03/12/2017

Préparation des données

Sur Excel, nous déterminons le nombre de jours entre deux dates par simple soustraction.

données

Tests

À présent testons sur XLSTAT l’adéquation de la distribution de ces écarts à une loi exponentielle. Son paramètre λ est déterminé par le logiciel, soit 0,007. Nous pouvons aussi bien le renseigner après l’avoir calculé. Rappelons que ce paramètre est l’inverse de l’espérance : 13 périodes divisées par une somme de 1 795 jours (total de la colonne) donne bien 0,007.

XLSTAT permet de réaliser deux tests d’adéquation : le test du khi² et celui de Durbin-Watson. Et ceci avec deux méthodes possibles : le maximum de vraisemblance (choisi ici) et les moments. Le risque d’erreur accepté est de 5 %.

Résultats

Kolmogorov

Selon le test de Kolmogorov-Smirnov, la p-value est supérieure à 0,05. Donc on ne peut pas rejeter l’hypothèse selon laquelle l’échantillon suit une loi exponentielle. Le risque de la rejeter alors qu’elle est vraie est de 83,1 %.

khi²

Le test du khi² est moins catégorique. La conclusion est la même mais le risque de rejeter l’hypothèse que l’échantillon suit une loi exponentielle n’est « que » de 53,9 %.

La population ayant été divisée en dix classes, nous pouvons comparer les observations avec des nombres de durées théorique pour chacune d'elles. Compte tenu du faible nombre d’observations par classe dans notre exemple (deux au maximum), ce graphique peut certes avoir un intérêt pédagogique mais peu d’intérêt pratique.

comparaison

Exemple modifié

Modifions caricaturalement notre exemple. Presque toutes les pannes ont lieu en décembre 2017.

données

Cette fois-ci la conclusion est clairement que l’échantillon ne suit pas une loi exponentielle !

Kolmogorov  khi²