Le centre de gravité

Barycentre (introduction et utilisation en statistiques)

Voici une notion souvent rencontrée en statistiques et en analyse des données. Jadis étudiée au lycée et de compréhension intuitive, elle n’est pas développée outre mesure dans les filières économiques de l’enseignement supérieur.

 

Présentation

Flash-back.

Notre première rencontre avec le centre de gravité en tant que notion mathématique eut lieu dans ce riche espace qu’est la géométrie euclidienne. Rencontre peu romantique mais néanmoins prometteuse, elle permettait de résoudre d’enthousiasmants problèmes de poids à placer sur des balances, voire de points \(G\) à découvrir…

En effet, il est coutumier de nommer \(G\) un centre de gravité.

Commençons par le plus simple : le barycentre de deux points identiquement pondérés se trouve au milieu du segment.

Poursuivons dans un plan. Soit \(G\) le centre de gravité de trois points \(A\), \(B\) et \(C\) pondérés de façon égale.

triangle

La somme des trois vecteurs \(\overrightarrow {GA} \), \(\overrightarrow {GB} \) et \(\overrightarrow {GC} \) est égale à zéro. D'ailleurs, ça continue à très bien fonctionner au-delà de trois vecteurs (voir en page trapèze le centre de gravité de ce quadrilatère).

Revenons à deux points seulement mais cette fois différemment pondérés. Soit \([AB]\) un segment de droite, \(A\) est pondéré par 3 et \(B\) par 2, alors \(G\) se situe là où trois fois \(\overrightarrow {GA} \) plus deux fois \(\overrightarrow {GB} \) est égal au vecteur nul \(\overrightarrow 0 \). D’où \(\overrightarrow {AG} = \frac{2}{5}\overrightarrow {AB} \)

Ceci se démontre par la relation de Chasles mais le dessin ci-dessous l'illustre de façon plus intuitive. Par ailleurs, si les pondérations sont multipliées par un même réel, ça ne change rien à l’emplacement de \(G\). Peu importe que l’on place sur la balance des pommes ou des demi-pommes.

pommes sur balance

 

Pondérations

Un point pondéré s'écrit \((A,a)\). En l'occurrence, le point \(A\) est affecté d'une pondération \(a\). Le barycentre de plusieurs points n'existe que si la somme de leurs pondérations n'est pas nulle.

Une pondération peut être négative (très rarement dans les problématiques statistiques !) et si les deux pondérations sont de signes opposés, \(G\) ne se situe pas sur le segment \([AB]\) mais reste sur la droite qui relie ces points. Entre deux points, il est toujours plus près de celui qui, en valeur absolue, présente la pondération la plus élevée.

Il est temps de présenter la formule de définition du barycentre \(G\) de \((A,a)\) et \((B,b)\) : \(a\overrightarrow {GA} + b\overrightarrow {GB} = \overrightarrow 0 \)

Exemple. Soit un segment \([AB]\). Placer le centre de gravité \(G\) tel que \( - 3\overrightarrow {GA} + 4\overrightarrow {GB} = \overrightarrow 0 \).

\(\begin{array}{l} - 3\overrightarrow {GA} + 4(\overrightarrow {GA} + \overrightarrow {AB} ) = \overrightarrow 0 \\ \Leftrightarrow \overrightarrow {GA} + 4\overrightarrow {AB} = \overrightarrow 0 \\ \Leftrightarrow \overrightarrow {AG} = 4\overrightarrow {AB} \end{array}\)

G

Il existe toutefois une autre formule du barycentre, plus opérationnelle. Quel que soit un point \(M\), on doit avoir \(a\overrightarrow {MA} + b\overrightarrow {MB} = (a + b)\overrightarrow {MG} \).

Et si l'on remplace \(M\) par \(A\), il n'est pas difficile de montrer que, pour \((A,a)\) et \((B,b)\), avec \(a + b \ne 0\), on obtient \(\overrightarrow {AG} = \frac{b}{{a + b}}\overrightarrow {AB} \).

Progressons. Cette belle mécanique fonctionne bien sûr avec un nombre quelconque de points. L'exemple suivant en utilise trois.

Où se stitue le barycentre de \((A,5)\), \((B,-2)\) et \((C,1)\) ?

Pour tout point \(M\), nous avons l’égalité \(5\overrightarrow {MA} - 2\overrightarrow {MB} + \overrightarrow {MC} = (5 - 2 + 1)\overrightarrow {MG} \).

Pour déterminer \(G\), nous partons de l’un des trois sommets du triangle. Choisissons \(C\) mais nous pourrions en prendre un autre... Ainsi, \(M=C\).

\(\begin{array}{l} 5\overrightarrow {CA} - 2\overrightarrow {CB} = 4\overrightarrow {CG} \\ \Leftrightarrow \overrightarrow {CG} = \frac{1}{2}\overrightarrow {BC} + \frac{5}{4}\overrightarrow {CA} \end{array}\)

Précisons tout de même qu'au-delà de trois points, il est souvent plus simple d'utiliser les propriétés de l'associativité du barycentre plutôt que ces formules (en dépit de leur indiscutable charme)....

Certes, la notion de barycentre est essentielle en analyse des données. Toutefois, cette utilisation n'a pas pour cadre la géométrie pure, comme ici, mais celui de repères normés.

 

Prolongements statistiques

Le barycentre peut être considéré comme une extension de la notion de moyenne pondérée. Ainsi, une moyenne arithmétique pondérée est le barycentre des valeurs des observations. L’espérance mathématique, qui est la moyenne des valeurs pondérées par leurs probabilités, est aussi un barycentre.

Pour les problématiques statistiques, le barycentre est synonyme de centre de gravité. En revanche, la définition du centre d’inertie est différente mais ce dernier n’est pas utilisé en analyse de données. Ce sont bien les centres de gravité des nuages de points qui sont recherchés lorsque l’on procède aux k-means et c’est à partir d'eux que l’on calcule les inerties, ce qui n'est pas la même chose.

 

barycentre