Tests d'adéquation à un processus de Poisson
Lorsqu’un même évènement survient successivement de façon aléatoire et relativement rare, nous sommes en présence d’un processus de Poisson. Réciproquement, le fait de tester un processus afin d’estimer son caractère poissonien permet de valider ou non l’hypothèse selon laquelle les évènements surviennent de façon aléatoire. Illustrons-le avec deux exemples.
Problématique
On a relevé les dates auxquelles une machine est tombée en panne sur une période de cinq ans. En principe, les pannes ne devraient être liées qu’aux circuits électroniques dont la durée de vie obéit à une loi exponentielle (sans vieillissement). Mais il semblerait qu’elles soient devenues plus nombreuses. Est-ce un simple effet du hasard ? Si oui, nous sommes en présence d’un processus de Poisson.
Il existe deux techniques pour tester si le processus est poissonien : vérifier si le nombre de pannes survenant au cours d’une période obéit à une loi de Poisson ou vérifier si les durées qui séparent deux pannes suivent une loi exponentielle. C’est cette seconde option qui a été choisie.
Données
Les dates auxquelles sont apparues des pannes entre début 2013 et fin 2017 sont les suivantes :
pannes |
03/01/2013 |
14/09/2013 |
08/12/2013 |
07/06/2014 |
22/10/2014 |
06/03/2015 |
30/01/2016 |
15/04/2016 |
09/11/2016 |
02/08/2017 |
09/09/2017 |
30/09/2017 |
20/10/2017 |
03/12/2017 |
Préparation des données
avec Excel, nous déterminons le nombre de jours entre deux dates par simple soustraction.
Tests
À présent testons sur XLSTAT l’adéquation de la distribution de ces écarts à une loi exponentielle. Son paramètre \(λ\) est déterminé par le logiciel, soit 0,007. Nous pouvons aussi bien le renseigner après l’avoir calculé. Rappelons que ce paramètre est l’inverse de l’espérance : 13 périodes divisées par une somme de 1 795 jours (total de la colonne) donne bien 0,007.
XLSTAT permet de réaliser deux tests d’adéquation : le test du khi² et celui de Durbin-Watson. Et ceci avec deux méthodes possibles : le maximum de vraisemblance (choisi ici) et les moments. Le risque d’erreur accepté est de \(5\%.\)
Résultats
Selon le test de Kolmogorov-Smirnov, la p-value est supérieure à 0,05. Donc on ne peut pas rejeter l’hypothèse selon laquelle l’échantillon suit une loi exponentielle. Le risque de la rejeter alors qu’elle est vraie est de \(83,1\%.\)
Le test du khi² est moins catégorique. La conclusion est la même mais le risque de rejeter l’hypothèse que l’échantillon suit une loi exponentielle n’est « que » de \(53,9\%.\)
La population (au sens statistique) ayant été divisée en dix classes, nous pouvons comparer les valeurs observées avec des nombres de durées théorique pour chacune d'elles. Compte tenu du faible effectif par classe dans notre exemple (deux au maximum), ce graphique peut certes présenter un intérêt pédagogique mais peu d’intérêt pratique.
Exemple modifié
Modifions caricaturalement notre exemple. Presque toutes les pannes ont lieu en décembre 2017.
Cette fois-ci la conclusion est clairement que l’échantillon ne suit pas une loi exponentielle !