Indice de Gini et courbe de Lorentz
Sur cette page, nous allons explorer un sujet transversal bien que rarement présenté comme tel : celui de la concentration des valeurs observées, c’est-à-dire de l’inégalité d’une répartition. Utilisé en macro-économie et notamment par l’OCDE et l’INSEE pour comparer les inégalités de revenu, l’indice de Gini est employé en entreprise dans trois domaines très différents : Pour la direction des ressources humaines, c’est l’indicateur qui résume l’inégalité des rémunérations dans l’entreprise ou l’unité considérée. Pour le logisticien, courbes et indice de concentration permettent une bonne disposition des articles en magasin en fonction de leurs flux. C’est une sophistication du zonage ABC. Dans le cadre du scoring, il est très utilisé pour évaluer la plus ou moins bonne qualité d’une grille. La concentration doit être distinguée de la dispersion. Lorsqu’on étudie la concentration des revenus, on utilise une courbe de Lorentz. En abscisses sont représentées les fréquences cumulées (par exemple les 10 déciles) et en ordonnées se trouvent les pourcentages cumulés de revenus (proportion de personnes situées en-deçà du décile). C’est-à-dire que si la répartition est parfaitement égalitaire, la courbe est confondue avec la première bissectrice mais dans tous les autres cas, elle se situe au-dessous. La courbe de Lorentz part de l’origine (0 % de la population perçoit 0 % du revenu) et se termine au point (1 , 1) ou (100 %,100 %). Ci-dessous, on classe l’effectif d’une unité de production par rémunération perçue, en ordre croissant, puis on effectue un décilage. On relève ensuite le salaire moyen de chaque écart inter-décile puis la part de ce salaire par rapport au total de la colonne (en d’autres termes, la part de la tranche de rémunérations correspondante dans la masse salariale). Le cumul de ces parts est résumé par la courbe de Lorentz, en rouge. Ici, 20 % de l’effectif (rémunérations modestes) se partage 9,24 % de la masse salariale.
La surface se trouvant entre les deux courbes se nomme surface de concentration. Plus elle est faible et plus la distribution est égalitaire. Le maximum est de 0,5 (situation d’un seul maître et d’esclaves !). Afin d’obtenir une grandeur comprise entre 0 et 1, on multiplie cette valeur par 2. Le résultat est appelé indice de Gini. Dans une problématique de scoring (ou plus globalement de risque ou de marketing), l’indice de Gini ne se réfère pas à la différence entre courbe de Lorentz et première bissectrice mais entre une courbe constatée (ROC ou de lift) et une situation parfaite de discrimination fiable à 100 %. Un peu de maths La suite de cette page présente peu d’intérêt pratique. Il s’agit juste d’un petit exercice visant à remémorer les principes de base de l’intégration. Une autre façon de présenter l’indice de Gini consiste à rapporter la surface de concentration au triangle délimité par l’axe des abscisses, une droite d’équation x = 1 et la première bissectrice.
Il est évident que l’aire du triangle est égale à ½. Soit f(x) l’expression de la courbe de Lorentz. La surface de concentration est donc la différence entre la droite d’équation y = x et f(x) entre les valeurs 0 et 1. Donc :
Supposons que votre logiciel estime par l’équation y = x² votre courbe de Lorentz. À combien s’élève l’indice de Gini ? Réponse :
|






