Les distances

Normes et distances, euclidiennes ou non

Si les techniques quantitatives utilisent une notion récurrente, c’est bien celle de distance sur un ensemble. Seulement voilà, il en existe plusieurs mesures.

Sur \(\mathbb{R},\) la question ne se pose pas. Pour connaître la distance entre deux nombres, il suffit de prendre la valeur absolue de leur différence. C'est la distance usuelle. Les difficultés commencent à partir de deux dimensions.

La plus « universelle » est sans doute Sa Majesté la distance euclidienne : analyses factorielles, classifications, régressions, analyse, géométrie, algèbre... Elle est partout. Parfois en situation de monopole, parfois en concurrence avec d’autres. Elle est enseignée au collège et en seconde (Cf. page sur la géométrie analytique).

Il faut d'abord une norme pour pouvoir définir une distance.

 

Normes

Voyons d’abord ce qu'est une norme. Il s'agit d'une application \(N\) d'un espace vectoriel \(E\) dans \(\mathbb{R}\).

Nous utiliserons la notation \(N(X) = \left\| X \right\|.\) L'espace vectoriel normé s'écrit \((E, N).\)

La norme vérifie des propriétés assez simples à comprendre. D’abord, si la norme d’un nombre ou plus généralement d’un vecteur est nulle, c’est que celui-ci est nul. Les autres propriétés peuvent être ainsi formalisées pour les vecteurs \(X\) et \(Y\) (la norme est indiquée par un encadrement de doubles barres) :

\(\forall X \in {\mathbb{R}^n},\) \(\forall \lambda \in \mathbb{R},\) \(\left\| {\lambda X} \right\| = \left| \lambda \right|\left\| X \right\|\)

\(\forall (X,Y) \in {\mathbb{R}^n} \times {\mathbb{R}^n},\) \(\left\| {X + Y} \right\| \leqslant \left\| X \right\| + \left\| Y \right\|\)

Cette inégalité est celle de Minkowski, encore appelée triangulaire (voir ci-dessous, le principe s'appliquant aussi aux distances).

Graphiquement, une norme permet de placer une figure géométrique dans un plan ou un espace muni d'un repère normé, et même orthonormé si les axes sont orthogonaux entre eux. Au lycée, on apprécie l'intérêt d'une norme lorsqu'on quitte la géométrie pure pour la géométrie analytique.

  1. La norme 1 est celle des valeurs absolues. Ainsi, la norme 1 du vecteur de \(\mathbb{R}^2\) de coordonnées \((4\,; -3)\) est égale à la somme de \(|4|\) et de \(|-3|,\) soit 7.

  2. La norme 2 est la norme euclidienne, du moins dans l'espace \(\mathbb{R}^n.\) C’est la racine carrée de la somme des carrés. Pour reprendre notre exemple, dans un repère orthonormé, la norme 2 du vecteur de coordonnées \((4\,; -3)\) est égale à :

    \(\sqrt{4^2+(-3)^2}\) \(= \sqrt{16+9}\) \(= \sqrt{25}\) \(=5\)

    La distance entre l’origine et le point de coordonnées \((4\,; -3)\) est donc égale à 5. Ceci nous amène bien sûr au théorème de Pythagore. Le carré de l’hypoténuse qui mesure 5 est égal à la somme des carrés des côtés qui mesurent 4 et 3. En langage courant, c’est la distance « à vol d’oiseau ». La norme euclidienne est définie à partir du produit scalaire.

    \(u.v = \left\|u\right\| \times \left\|v\right\| \times \cos(u.v)\)

    Ou \(u.v = \frac{1}{2}(\left\|u + v \right\|^2 - \left\|u\right\|^2 - \left\|v\right\|^2)\)

    Note : dans l'espace vectoriel des complexes \(\mathbb{C}^n,\) il s'agit de la norme hermitienne.

  3. Enfin, la norme 3, ou uniforme, ou encore infinie, est la valeur absolue maximale.

    \(\left\|(x_1,x_2)\right\|_3 = \max\{|x_1|,|x_2|\}\)

  4. La norme du vecteur de coordonnées \((4\,;-3)\) est alors égale à 4.

Deux normes \(N_{\alpha}\) et \(N_{\beta}\) sont équivalentes si toute suite qui converge vers \(l\) pour une norme converge aussi vers \(l\) pour l'autre. Bon, là ça devient un peu abstrait...

Formellement, il faut qu'il existe deux réels \(a\) et \(b\) strictement positifs tels que \(\forall X \in E,\) nous avons \(aN_{\beta}(X) \leqslant N_{\alpha}(X) \leqslant bN_{\beta}(X).\)

Dans un espace vectoriel de dimension finie, les normes sont équivalents.

distance

 

Distances entre deux points

Revenons à nos distances, associées aux normes. Une distance est elle aussi une application, mais cette fois-ci de \(\mathbb{R}^n \times \mathbb{R}^n\) dans \(\mathbb{R}\) puisqu'il faut deux points pour en définir une. La distance entre un point \(A\) et son confrère \(B\) est égale à la norme du vecteur qui les lie. \(\left\|AB\right\| = AB.\)

D'évidentes propriétés découlent de celles des normes : la distance d’un point à lui-même est nulle (belle découverte mais ça va mieux en le disant), la distance entre deux points distincts est positive, celle qui part de \(X\) pour aller à \(Y\) est égale à celle qui fait le chemin inverse (symétrie) et si l’on passe par un point \(C\) pour aller de \(A\) à \(B,\) on ne raccourcit pas la distance qui existe entre \(A\) et \(B.\) C'est l'inégalité triangulaire. On la visualise bien sur le dessin ci-dessous. Où que \(B\) puisse se trouver, \(AC \leqslant AB + BC,\) l'égalité se vérifiant bien sûr lorsque \(B\) se situe sur le segment \([AB]\) et l'inégalité stricte se vérifiant partout ailleurs.

inégalité triangulaire

La valeur absolue permet de définir la distance de Manhattan qui fait partie des quelques distances utilisables en classification.

La distance euclidienne est abondamment utilisée au collège puis au lycée dans les espaces à deux dimensions. Exemple ultra-classique :

Dans le plan muni d'un repère orthonormé, définir le triangle formé par les points \(A(1\,;1),\) \(B(5\,;-1)\) et \(C(3\,;5).\)

La distance entre \(A\) et \(B\) est égale à...

\(d(AB) = \sqrt{(x_B - x_A)^2 + (y_B - y_A)^2}\)

Donc \(d(AB) = \sqrt{(5-1)^2+(-1-1)^2}\) soit \(\sqrt{20}.\)

De même, on calcule \(d(AC)\) et l'on découvre le même résultat. Enfin, \(d(BC)\ = \sqrt{40}.\) Comme \(d(AB) = d(AC),\) la conclusion est sans appel : \(ABC\) est isocèle en \(A.\) Par ailleurs, on remarque que \(d^2(AB) + d^2(AC) = d^2(BC).\) Selon la réciproque du théorème de Pythagore, le triangle \(ABC\) est rectangle en \(A.\)

Dans un espace à \(n\) dimensions, la distance euclidienne entre les points \(X(x_1\,;x_2 …;x_n)\) et \(Y(y_1\,;y_2 …;y_n)\) est, vous l’avez deviné :

\[d(X,Y) = \sqrt {\sum\limits_{i = 1}^n {{{\left( {{y_i} - {x_i}} \right)}^2}} } \]

C’est une notion essentielle pour l’étude des fonctions de deux variables ou plus.

En statistiques, on raisonne en carrés des distances (on « oublie » la racine), ce qui en facilite la décomposition (voir la page inertie).

La distance de Minkowski, ou p-distance, généralise l’euclidienne : c’est la racine pème de la somme des valeurs absolues des écarts à la puissance \(p.\) La norme 3 définit la distance de Tchebichev. C’est la distance de Minkowski où \(p\) est infini.

Enfin, une distance discrète est une distance qui vaut 0 si \(X = Y\) et 1 si \(X \ne Y.\)

Un espace métrique est un espace topologique muni d'une distance. Le plus utilisé est \(\mathbb{R}^n.\) Normes et distances permettent d'y définir des boules. Ce sujet est traité en page de voisinages et boules.