Moyennes quadratique, harmonique et géométrique
A priori, rien de plus basique qu’une moyenne. Or, non seulement sa définition n'est pas si simple que cela, mais il existe théoriquement une infinité de façons de la calculer. N’allez pas croire pour autant que vous apprendrez ici à falsifier les chiffres...
Présentation
Supposons que l'on veuille résumer une distribution à une seule variable. Dans la quasi-totalité des cas, on calcule la moyenne arithmétique (ou plus exactement la formule arithmétique de la moyenne), éventuellement pondérée si l'on dispose de données agrégées. Mais parfois elle n’est pas adaptée à la problématique.
Nous allons passer en revue les trois formules non arithmétiques de moyennes les plus courantes (enfin, les moins rares…) et leurs applications, ainsi que la façon de les obtenir avec Excel.
Soit une série de \(n\) valeurs \(x_1,\) ..., \(x_i,\) ..., \(x_n.\)
La moyenne quadratique
La moyenne quadratique (root mean square) est la racine carrée de la moyenne arithmétique des carrés (moment non centré d’ordre 2).
\(\displaystyle{Q = \sqrt{\frac{\sum_{i=1}^n {x_i^2}}{n}}}\)
Un écart-type est donc une moyenne quadratique des écarts entre les valeurs observées et leur moyenne arithmétique. D’une manière générale, elle est surtout utilisée lorsqu’on raisonne sur des carrés.
Il n’existe pas de fonction spécifique pour Excel mais on s'en passe facilement…
La moyenne harmonique
La moyenne harmonique (harmonic mean) est le moment d’ordre -1 ou, pour être un peu plus clair (?), l’inverse de la moyenne arithmétique des inverses.
\(\displaystyle{H = \frac{n}{\sum_{i=1}^n \frac{1}{x_i}}}\)
On l’utilise lorsque l'inverse de la variable signifie quelque chose. Mais la moyenne arithmétique permet toujours de retrouver, plus ou moins facilement, le même résultat.
L’exemple habituel est celui de la vitesse moyenne calculée sur un parcours en plusieurs étapes. Si un poids lourd roule à 110 km/h sur 100 km d’autoroute puis à 50 km/h sur 100 km de route, sa vitesse moyenne n’est pas de 80 km/h mais elle est inférieure puisqu’il a roulé plus longtemps à vitesse réduite qu’à vitesse élevée. Sa vitesse moyenne est de \(\displaystyle{\frac{2}{\frac{1}{110} + \frac{1}{50}}}\) \(=\) \(68,75\) km/h, chiffre que l’on retrouve sur Excel avec la fonction MOYENNE.HARMONIQUE.
Pourquoi avoir choisi la formule harmonique ? La vitesse est une distance rapportée à un temps. Mais l'inverse, c'est-à-dire un temps rapporté à une distance, a aussi une signification. C'est la réponse à la question : « quel temps faut-il pour parcourir telle distance ? »
Autre exemple pour monter le lien qui existe entre cette formule de moyenne et l’arithmétique. Un fabricant de farces et attrapes fait vérifier par un testeur courageux trois lots de boules puantes, un plaisantin mal intentionnée ayant subtilisé quelques pièces pour y introduire du 5 de Chanel. Chaque lot inclut des boules défectueuses.
Comme on relève 10 pièces défectueuses sur 110, le taux moyen est de \(9,1\%.\) C’est une moyenne arithmétique. Si l'on souhaite retrouver ce résultat directement à partir de la colonne « taux », on l'obtient en posant \(\displaystyle{\frac{110}{50 \times 1,12 + 40 \times 0,075 + 20 \times 0,05}},\) solution de bon sens que l’on aurait trouvé en ignorant avoir calculé une moyenne harmonique pondérée.
Là encore, observons que l'inverse d'un taux signifie bien quelque chose. En l'occurrence, la réponse à la question « combien de pièces faut-il relever en moyenne pour trouver une défectueuse ? »
Remarque : par définition, cette formule est inutilisable si \(x\) prend la valeur 0.
La moyenne géométrique
La moyenne géométrique (geometric mean) est la plus utilisée des trois.
Lorsque les observations sont cumulatives, on utilise la formule géométrique. Il s’agit de la racine énième du produit des \(n\) observations. Cette définition exclut les nombres négatifs.
\(\displaystyle{G = \sqrt[n]{\prod_{i=1}^n {x_i}}}\)
Cette formule peut d’ailleurs être transformée en somme par la magie des logarithmes.
\(\displaystyle{\ln G = \frac{1}{n} \sum_{i=1}^n {\ln x}}\)
Illustrons. Soit une production de 100. Sur une année, la progression trimestrielle est de \(2\%\) puis \(3\%\) puis \(1\%\) puis \(1\%.\) Quelle est la progression trimestrielle moyenne ?
Calculons ceci de trois façons différentes.
Première méthode : \(100\) \(×\) \(1,02\) \(×\) \(1,03\) \(×\) \(1,01\) \(×\) \(1,01\) \(=\) \(107,17\)
Soit \(r\) la progression trimestrielle moyenne. Donc \(100 × (1 + r)^4\) \(=\) \(107,17\)
Utilisons les logarithmes pour simplifier notre affaire : \(\ln 100 + 4\ln(1 + r)\) \(=\) \(\ln 107,17\)
\(4,605 + 4\ln(1 + r)\) \(=\) \(4,674,\) donc \(\ln(1 + r) = 0,173\) et \(r =\) \(\exp\)\(\;(0,173 - 1),\) soit \(+1,747\%.\)
Deuxième méthode : calculons le produit \(1,02\) \(×\) \(1,03\) \(×\) \(1,01\) \(×\) \(1,01\) \(=\) \(1,0717\) dont la racine quatrième (ou la puissance \(\frac{1}{4}\)) est égale à 1,01747. On sait depuis le collège que ce coefficient multiplicateur traduit une augmentation de \(1,747\%.\)
Méthode pratique : avec Excel on entre 1,02, 1,03, 1,01 et 1,01 puis on appelle la fonction MOYENNE.GEOMETRIQUE. On obtient 1,01747 et l'on conclut que le taux de croissance moyen s'établit à \(1,747\%.\) Évidemment, c'est plus simple…
La moyenne géométrique est utilisée en mathématiques financières pour trouver un taux proportionnel (exemple en page d'annuités). D'une façon plus générale, elle permet de calculer la rentabilité moyenne annuelle d'un investissement sur une longue période.
Pour conclure, précisons que sur un même échantillon la moyenne la plus élevée est la quadratique, suivie de l'arithmétique, la géométrique et enfin l'harmonique (avec \(x_i > 0\)).