Techniques et concepts de l'entreprise, de la finance et de l'économie 
(et fondements mathématiques)

Les tests préalables à une analyse discriminante

logo

 

 

 

 

 

 

 

 

 

 

Exemple de sélection d'une variable discriminante

Bien qu’une AFD ou une analyse discriminante décisionnelle peuvent se contenter d’hypothèses de normalité et d’homoscédasticité pas tout à fait satisfaites, il est plus sûr de vérifier qu’une méthode non linéaire n’est pas préférable…  Les étapes illustrées sur cette page illustrent le processus décrit en page sélection de variables pour une analyse discriminante.

Exemple de tests de normalité

Ceci est le détail du traitement de la variable km / an, extraite de l’exemple de la page AFD.

Dans le cadre d’une étude de marché pour un constructeur automobile, un échantillon de trente automobilistes possédant un modèle particulier est interrogé. Celui-ci est séparé en deux groupes égaux : ceux qui changeront probablement de véhicule dans les deux ans à venir et ceux qui ne comptent pas le faire.

Variable à expliquer : 1 = pas de changement prévu. 2 = changement prévu.

Données

Nous avons deux modalités de variable à expliquer × 5 explicatives = 10 distributions à tester mais on ne s’intéressera ici qu’à la variable km / an.

Réalisation sur XLSTAT (extrait) :

Ne sont repris ici que les tests de la PREMIÈRE distribution (km / an si aucun changement prévu, soit = 15). Cliquer sur « Description des données ».

H0 : distributions normales. H1 : distributions un peu trop fantaisistes.

Shapiro

C’est OK. On ne rejette pas l’hypothèse de normalité au seuil de signification 0,05. Voyons si les autres tests confortent cette décision.

Jarque-Bera
Anderson-Darling

Lilliefors

Toutes les p-values sont supérieures à 0,05. Ceci ne permet pas d’affirmer haut et fort que la distribution est normale mais, au moins, on peut poursuivre l’analyse…

Exemple de test du F

Peut-on considérer que, sur la variable km / an, les variances sont égales au seuil de 0,05 entre les groupes « changement » et « non changement » ?

Test de comparaison de variances : H0, variances identiques. H1, variances différentes.

Après un premier tableau de statistiques descriptives, XLSTAT donne les résultats suivants :

Test F

Joie ! On peut supposer l’homoscédasticité entre les deux groupes et, sous réserve de la même vérification sur les autres variables, envisager une analyse discriminante !

Test de comparaison de moyennes

S’il s’avère que km / an figure parmi les « nominés », on ne peut pas pour autant affirmer que cette variable est discriminante. L’examen suivant est particulièrement important : le nombre moyen de km / an est-il suffisamment différent entre les automobilistes qui changeront de voiture et les autres ?

Hypothèses : H0, les moyennes sont égales. H1, elles sont différentes.

Extraits de XLSTAT (test non paramétrique puis test t).

Stats descriptives

Test t

On peut rejeter l’hypothèse nulle d’égalité des moyennes et prendre en compte cette variable dans l’analyse. Que du bonheur…

 

testeur

 

© JY Baudot - Droits d'auteur protégés