Moyenne
En mathématiques, la moyenne est un outil de calcul permettant de résumer une liste de valeurs numériques en un seul nombre réel, indépendamment de l’ordre dans lequel la liste est donnée. Par défaut, il s’agit de la moyenne arithmétique, qui se calcule comme la somme des termes de la liste, divisée par le nombre de termes[2]. D’autres moyennes peuvent être plus adaptées selon les contextes.
La moyenne est un des premiers indicateurs statistiques pour une série de nombres. Lorsque ces nombres représentent une quantité partagée entre des individus, la moyenne exprime la valeur qu’aurait chacun si le partage était équitable.
La notion de moyenne s’étend aux fonctions avec la valeur moyenne, en géométrie classique avec le barycentre et en théorie des probabilités avec l’espérance d’une variable aléatoire.
Motivation
modifierValeur intermédiaire
modifierLa notion de moyenne est historiquement reliée à celle de valeur intermédiaire, appelée aussi médiété[3]. Étant donnés deux nombres a et b, comment choisir une valeur c pour que a soit à c ce que c soit à b ? La réponse diffère selon l’opération choisie pour aller d’un nombre à l’autre.
Par exemple, pour aller de 2 à 18, on peut ajouter deux fois 8, avec une étape en 10, ou multiplier deux fois par 3, avec une étape en 6. Le premier cas décrit une moyenne arithmétique, qui s’obtient par la fraction . Le second cas est une moyenne géométrique, qui s’obtient avec la racine carrée .
Les identités remarquables usuelles permettent de montrer rapidement que la moyenne géométrique de deux nombres positifs est toujours inférieure à leur moyenne arithmétique.
Égalisation
modifierUne autre manière de définir ces moyennes est de cumuler les nombres choisis puis de chercher comment on peut obtenir le même résultat en cumulant plusieurs fois la même valeur. Tout dépend alors de la procédure de cumul. Avec une addition, on trouve 2+18=20, qu’on aurait pu obtenir en posant 10+10=20. Avec une multiplication, on trouve 2×18=36, qu’on aurait pu obtenir avec 6×6=36.
D’autres procédures de cumul sur deux nombres a et b permettent de définir la moyenne harmonique et la moyenne quadratique .
Cette approche permet de définir les moyennes pour des listes de plus de deux nombres.
Position d'équilibre
modifierLa moyenne peut aussi être concrétisée par le point d'équilibre d’un ensemble fini de masses ponctuelles positionnées le long de la droite numérique, comme sur un mobile.
Cette approche permet d’introduire naturellement la notion de moyenne pondérée. Par exemple, on peut souhaiter que la moyenne soit trois fois plus proche de la première valeur que de la deuxième. Entre 7 et 19, le nombre 10 est bien trois fois plus proche de 7 (avec un écart de 3) que de 19 (avec un écart de 9). On dit alors que 10 est la moyenne pondérée des nombres 7 et 19 avec les coefficients 3 et 1. On le trouve en calculant la somme pondérée que l’on divise par la somme des coefficients .
Moyenne comme meilleure approximation
modifierDans le cas où on cherche à évaluer une moyenne de plusieurs points, il vient naturellement de s'intéresser aux distances. La moyenne d'un n-uplet de points (x1, ... ,xn) dans un ensemble de réels X devient alors la valeur qui minimise[4],[5]
pour une distance d définie sur X.
Le problème est que cette valeur minimale peut être atteinte en plusieurs points, voire ne pas être atteinte du tout.
Plusieurs moyennes sont induites par un problème de distance minimale :
- pour , la distance donne une mesure minimisée en un seul point, la moyenne arithmétique du n-uplet (application du théorème de Koenig-Huygens)
- pour , la distance induit la moyenne géométrique du n-uplet
- pour , la distance induit la moyenne harmonique du n-uplet
- Plus généralement, la distance induit la moyenne quasi-arithmétique selon f du n-uplet
En revanche, la mesure basée sur le symétrique du symbole delta de Kronecker
ne donnera pas une valeur moyenne du n-uplet mais son mode, et la distance usuelle d(x,y) = |x – y| renvoie la médiane.
Pour d'autres moyennes, comme la moyenne logarithmique, le problème reste ouvert car aucune distance associée n'a été déterminée.
On peut aussi évoquer la moyenne de Fréchet dans le cas où la fonctionnelle à minimiser est la variance de Fréchet[6]:
On parlera de moyenne de Karcher quand le minimum n'est pas atteint en un unique point, et de moyenne de Fréchet quand ce minimum est en un unique point.
Définition
modifierOn appelle moyenne de deux nombres x et y, une fonctionnelle continue vérifiant les propriétés suivantes :
Oscar Chisini donne une définition moins restrictive (en) d'une moyenne « substitutive », où la moyenne de x et y par rapport à m est la valeur t telle que[7],[8]:
Propriétés
modifierPour qu'une fonction xm = m(x1, ... ,xn) d'un n-uplet de réels x = (x1, ... ,xn) pris dans un ensemble X, puisse être utilisée comme moyenne de x :
- la valeur xm doit être intermédiaire[9]:
- la valeur xm doit vérifier la propriété d'identité : si toutes les valeurs du n-uplet sont égales, le calcul de la moyenne doit donner cette valeur :
On peut ajouter d'autres propriétés, comme l'homogénéité de degré 1 :
ou la symétrie : toute permutation des coefficients du n-uplet ne change pas la valeur moyenne
ou encore la croissance, pour :
- les fonctions sont croissantes[10].
Formulations
modifierMoyenne arithmétique
modifierPour toute liste (x1, ..., xn) de réels, on définit sa moyenne arithmétique par la formule , qui ne dépend pas de l’ordre des termes et est toujours comprise entre les valeurs minimale et maximale de la liste.
Cette moyenne est linéaire, c’est-à-dire que l’addition ou la multiplication par une constante sur les valeurs de la liste se traduit par la même opération sur la moyenne.
Pour calculer une moyenne sur une liste dans laquelle beaucoup de valeurs sont répétées, on peut noter (x1, ..., xk) la liste des valeurs (sans répétition) et (n1, ..., nk) la liste des effectifs (le nombre de fois qu’apparait chaque valeur dans la liste initiale). La moyenne s’écrit alors .
On retrouve la notion de moyenne pondérée, dans laquelle les facteurs ni ne représentent pas nécessairement des effectifs, mais des coefficients appelés poids, par exemple pour calculer la moyenne de notes sur un bulletin scolaire dans lequel on souhaite accorder plus d’importance à certaines disciplines ou à certains devoirs, en leur attribuant un coefficient plus grand que les autres.
La moyenne arithmétique est aussi cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés.
Moyennes généralisées
modifierMoyenne d'ordre p
modifierÉtant donnée une liste (x1, ..., xn) de réels positifs (voire strictement positifs pour la moyenne harmonique), avec éventuellement une liste (m1, ..., mn) de poids associés, positifs et non tous nuls, on définit les moyennes usuelles suivantes.
Nom | Moyenne brute | Moyenne pondérée |
---|---|---|
moyenne arithmétique | ||
moyenne harmonique | ||
moyenne géométrique | ||
moyenne quadratique |
Ces moyennes reprennent certaines propriétés de la moyenne arithmétique :
- la moyenne ne dépend pas de l’ordre des termes ;
- la moyenne est toujours comprise entre la valeur minimale et la valeur maximale de la liste ;
- la moyenne est homogène, c’est-à-dire que si toutes les valeurs de la liste sont multipliées par un même facteur, la moyenne est multipliée par ce même facteur ;
- la moyenne est cumulative, c’est-à-dire que si la liste est partagée en plusieurs sous-listes, la moyenne de la liste globale est la moyenne pondérée des moyennes des sous-listes, avec pour coefficients de chaque sous-liste le nombre de termes concernés.
- la moyenne est croissante (par rapport à chaque )
En outre, ces moyennes sont toujours ordonnées par les inégalités suivantes qui prolongent l’inégalité arithmético-géométrique :
Toutes ces moyennes s’obtiennent sous la forme ou comme limite d’expressions sous cette forme, et entrent dans la définition de la moyenne d'ordre p. Plus précisément, on retrouve :
- pour p = 1, la moyenne arithmétique ;
- pour p = 2, la moyenne quadratique ;
- pour p = –1, la moyenne harmonique ;
- lorsque p → 0, la limite de xp est la moyenne géométrique ;
- lorsque p → +∞, la limite de xp est le maximum de la liste;
- lorsque p → –∞, la limite de xp est le minimum de la liste.
Autres moyennes
modifierParmi les autres moyennes de deux réels strictement positifs, on trouve :
- la moyenne de Héron :
- la moyenne contre-harmonique : où est la moyenne harmonique
- la centroidal mean d'un trapèze
- la moyenne logarithmique :
- la moyenne de Gini :
Moyennes quasi-arithmétiques
modifierOn peut définir la moyenne énergétique de la manière suivante :
C'est la moyenne de valeurs données en décibels, utilisées par exemple en acoustique.
Cette moyenne n’est pas homogène, mais elle reste cumulative, encadrée par le maximum et le minimum. Elle fait partie de la famille des moyennes quasi-arithmétiques qui s’écrivent sous la forme , où f est une fonction réelle continue et strictement croissante sur un intervalle contenant les valeurs de la liste, et f −1 est sa fonction réciproque. On retrouve en particulier les moyennes d'ordre p avec les fonctions puissances ou avec la fonction logarithme. La moyenne énergétique s’obtient avec la fonction .
Moyenne arithmético-géométrique
modifierÀ partir de deux nombres a et b, la moyenne arithmétique et la moyenne géométrique fournissant deux nouveaux nombres, et l’on peut itérer le processus pour obtenir deux suites adjacentes qui convergent vers un réel intermédiaire (parfois noté M(a,b)) appelé moyenne arithmético-géométrique et qui est relié à la longueur d’une ellipse.
Cette définition n’est cependant pas cumulative, et ne s’étend donc pas à plus de deux valeurs.
Autres familles de moyennes
modifierOn peut évoquer, pour deux réels strictement positifs :
- les moyennes de Lehmer[11] :
- où p est un réel quelconque.
- les moyennes de Stolarsky, qui basent leurs constructions sur une généralisation de la moyenne logarithmique par le théorème des accroissements finis[12],[13]:
- avec , soit
- , moyenne identrique et
- , moyenne logarithmique.
- les moyennes de Gini, introduites en 1938[12] :
- les moyennes symétriques :
- avec
- .
- les moyennes de Héron :
- pour p non nul et
- Seiffert en personne a étudié les cas :
Moyenne de Muirhead
modifierÉtant donnée une liste (a1, … , an) de réels et une liste (x1, … , xn) de réels strictement positifs, la a-moyenne de x est égale à la moyenne arithmétique des monômes de la forme x1aσ(1) × ⋯ × xnaσ(n) lorsque σ décrit l’ensemble des permutations de ⟦1, n⟧.
Cette moyenne est homogène lorsque la somme des exposants ai est égale à 1, et appelée dans ce cas moyenne de Muirhead.
Dans le cas particulier n = 2, cette moyenne est appelée moyenne de Heinz.
Moyennes comme une intégrale
modifierPour deux nombres réels a et b, Eves et Chen ont remarqué qu'on pouvait définir plusieurs moyennes par une fonction définie comme le rapport de deux intégrales similaires[15]. Plus précisément, pour une fonction f positive, continue, strictement croissante sur ]0;1] et telle que , alors
est bien une moyenne. De plus, en posant, pour une fonction φ positive, continue, strictement croissante sur ]0;1], alors :
permet de définir une moyenne sur le modèle précédent.
Par exemple, φ(x) := φt(x) = xt, on peut retrouver plusieurs moyennes définies plus haut :
- le cas t = –3 donne la moyenne harmonique ;
- le cas t = –3/2 donne la moyenne géométrique;
- le cas t = –1 donne la moyenne logarithmique ;
- le cas t = –1/2 donne la moyenne de Héron ;
- le cas t = 0 donne la moyenne arithmétique;
- le cas t = 1 donne la centroid mean.
De plus, la monotonie de f permet de retrouver les résultats d'inégalité entre les différentes moyennes.
Utilisations
modifierÉvaluation globale
modifierLa moyenne est beaucoup utilisée en évaluation scolaire. Dans de nombreux systèmes scolaires, une partie de l'évaluation des élèves débouche sur une note chiffrée, par exemple
- en France, en Tunisie, Algérie et au Maroc : de 0 à 10 ou de 0 à 20 (0 étant la plus mauvaise note, 10 ou 20 la meilleure) ;
- en Suisse : de 1 à 6 (1 étant la plus mauvaise note, 6 la meilleure) ;
- en Allemagne : de 6 à 1 (6 étant la plus mauvaise note, 1 la meilleure) ;
- au Canada : de 0 à 100 (0 étant la plus mauvaise note, 100 la meilleure) ;
- au Danemark : de -3 à 12 (-3 étant la plus mauvaise note, 12 la meilleure).
On peut alors calculer la moyenne des notes d'une classe dans une matière, ou la moyenne des notes d'un élève dans une matière. Ces moyennes ont des sens différents :
- la moyenne de la classe est censée représenter un « niveau global », si tant est que cela ait un sens ;
- dans le cas d'un examen de grande ampleur, comme le baccalauréat en France, où de nombreux élèves passent la même épreuve mais sont corrigés par différents professeurs, la différence des moyennes entre les groupes peut indiquer une différence de correction selon le professeur (certains étant plus sévères, d'autres plus tolérants), et l'on peut par exemple effectuer une correction de notes, une « mise en adéquation », afin que les groupes aient tous la même moyenne ; par exemple, si m1, m2… sont les moyennes des groupes et M la moyenne globale, alors les notes du groupe i seront multipliées par M/mi ;
- dans le cas d'un élève : la moyenne des notes sur une matière permet de niveler les résultats ; ainsi, si les résultats sont fluctuants, les faiblesses d'un moment sont rattrapées par les réussites d'un autre moment ;
- la moyenne des notes d'un élève dans plusieurs matières est une autre manière de niveler les résultats, non plus dans le temps mais selon la matière : les points forts rattrapent les points faibles ; la moyenne est alors un critère de sélection, sachant que ce que l'on demande d'un élève, ce n'est pas qu'il soit bon partout, mais qu'il ait des qualités permettant de rattraper ses défauts ; lorsque certaines matières sont plus importantes que d'autres, on applique des coefficients de pondération (cf. infra).
Dans ces exemples, la moyenne est un lissage des valeurs. On peut bien sûr se demander si la moyenne est un critère pertinent de sélection (voir Évaluation sommative) ; en général, ce n'est pas le seul critère qui entre en compte, à l'exception de certains examens et concours.
Statistique
modifierLa moyenne est la valeur unique que devraient avoir tous les individus d'une population (ou d'un échantillon) pour que leur total soit inchangé. C'est un critère de position.
Dans la plupart des cas, le total formé par les individus d'une population est la somme de leurs valeurs. La moyenne est alors la moyenne arithmétique. Mais si le total représenté par une population ou un échantillon n'est pas la somme de leurs valeurs, la moyenne pertinente ne sera plus la moyenne arithmétique.
Si, par exemple, le total d'un ensemble d'individus est le produit de leurs valeurs, il convient de calculer leur moyenne géométrique.
La moyenne ne peut donc se concevoir que pour une variable quantitative. On ne peut pas faire le total des valeurs d'une variable qualitative. Quand la variable est ordinale, on lui préférera la médiane.
Géométrie
modifierLe barycentre d’un ensemble fini de points du plan ou de l’espace affine (éventuellement munis de poids positifs ou négatifs) est défini par une relation vectorielle et correspond essentiellement à la notion physique de centre de masse.
Les coordonnées cartésiennes de ce barycentre dans un repère sont alors données par la moyenne arithmétique pondérée des coordonnées des différents points.
Analyse
modifierLe lemme de Cesàro assure que pour toute suite u convergente, la suite des moyennes partielles converge également vers la même limite.
Ce résultat permet d’étendre la notion de limite à des suites divergentes mais pour lesquelles la suite des moyennes partielles converge, comme la suite ((−1)n)n⩾0, dont les moyennes partielles tendent vers 0, ou la série associée, appelée série de Grandi, à laquelle on attribue alors la limite 1/2.
Ce procédé est utilisé par exemple dans la définition de somme de Fejér.
Probabilités
modifierLa moyenne empirique d’un échantillon de variables aléatoires réelles (X1, … , Xn) est simplement la moyenne arithmétique de ces variables, notée ou . C’est une variable qui a la même espérance que les variables Xi mais une variance divisée par n (sous condition d'existence). Elle sert notamment comme estimateur (statistique) de l’espérance.
Physique
modifierLes règles de conservation sur les différentes grandeurs physiques mènent à l’usage de moyennes différentes.
Ainsi, la capacité électrique moyenne de condensateurs en série est la moyenne harmonique de leurs capacités, comme la résistance (électricité) moyenne de conducteurs ohmiques en parallèle.
L’énergie cinétique dépendant linéairement du carré de la vitesse, la vitesse moyenne d’un ensemble de particules en agitation thermique est la moyenne quadratique des vitesses individuelles.
Extensions de la notion de moyenne
modifierAu-delà des définitions précédentes de moyenne, il existe d'autres approches plus étendues pour cette notion :
Moyenne glissante (ou « mobile »)
modifierLa moyenne glissante est une notion statistique, où la moyenne au lieu d'être calculée sur n valeurs fixes, est calculée sur n valeurs consécutives « glissantes ».
Ce type de calcul est aussi utilisé en informatique pour minimiser la taille mémoire nécessaire au stockage des valeurs intermédiaires. Différentes formules de moyennes glissantes existent, par exemple pour une moyenne glissante de période n :
- (une moyenne glissante de période 0 ne prend qu'un terme)
- (formule de récurrence)
Moyenne tronquée (ou « réduite »)
modifierUne moyenne tronquée est un calcul de moyenne arithmétique qui est appliqué après avoir ignoré les valeurs les plus extrêmes des données. L'idée de la troncation, opération dont le résultat s'appelle une troncature de l'ensemble des données, est de ne pas tenir compte des valeurs les plus éloignées, considérées alors comme aberrantes, et ainsi, dans le cas de la moyenne dite tronquée, de ne la calculer que sur un sous-ensemble « central » des données, la troncature. Notons que cette procédure est généralisable à d'autres estimateurs centraux.
Les statistiques tronquées, en anglais trimmed estimators (en), ont été inventées pour pallier la sensibilité des statistiques aux valeurs aberrantes, ce qu'on appelle la robustesse statistique. Leur avantage sur la médiane et sur la moyenne arithmétique est d'allier la robustesse de la médiane, à la définition « collective » de la moyenne arithmétique, la formule de calcul ressemblant fort à celle de cette moyenne arithmétique, lui conférant un avantage psychologique sur la médiane dont le défaut majeur (!) est de ne pas s'écrire avec une formule simplement arithmétique.
Historiquement, cette technique a eu son heure de gloire dans la première moitié du XXe siècle comme méthode de « correction » des valeurs aberrantes, et avec l'apparition des premiers calculateurs, notamment, jusqu'aux travaux plus récents pour mieux cerner la notion de robustesse (Peter Rousseeuw (en)).
Moyenne pondérée
modifierLa moyenne pondérée est utilisée, en géométrie pour localiser le barycentre d'un polygone, en physique pour déterminer le centre de gravité ou en statistique et probabilité pour calculer une espérance. On la calcule ainsi :
Dans le cas général le poids mi représente l'influence de l'élément xi par rapport aux autres.
À noter qu'il s'agit ici de la moyenne pondérée arithmétique. Il existe aussi des versions pondérées des autres moyennes, comme la moyenne géométrique pondérée et la moyenne harmonique pondérée.
Valeur moyenne d'une fonction
modifierPour toute fonction f continue sur un segment [a, b] non dégénéré (i. e. b > a) ou plus généralement intégrable sur ]a, b[, la valeur moyenne de f sur [a, b] est le réel défini par :
- .
L’inégalité de la moyenne permet d’encadrer cette valeur moyenne par des bornes de la fonction. Si la fonction est continue, le théorème de la moyenne assure même l’existence d’un réel c ∈ ]a, b[ tel que m = f(c).
Cette notion généralise celle de moyenne d'un nombre fini de réels en l'appliquant à un nombre infini de valeurs prises par une fonction intégrable. Elle sert par exemple dans la décomposition en série de Fourier d'une fonction périodique : c'est la composante constante. En traitement du signal, pour les signaux périodiques, il s'agit de la composante continue (offset).
On peut aussi, par analogie avec les moyennes pondérées d'un nombre fini de réels, affecter « à chacune des valeurs prises par la fonction » un coefficient strictement positif. On utilise alors ce que l'on appelle une fonction poids
(w pour l'initiale de weight, « poids » en anglais) :
- .
Ce procédé peut aussi s'utiliser sur un intervalle ouvert ou semi-ouvert mais borné (i. e. aucune de ses bornes n'est infinie) où la fonction ƒ×w est intégrable. On peut citer l'exemple classique servant à montrer l'orthogonalité de la famille des polynômes de Tchebychev :
où la fonction Tn×Tp est continue sur le fermé [0,1] et où la fonction poids est
est intégrable sur [0;1[, et dont l'intégrale vaut .
Nota : Lorsque la fonction est périodique de période T, elle a la même valeur moyenne sur toute période [a, a + T]. Cette valeur commune est appelée valeur moyenne de la fonction. Ainsi la fonction cosinus est de moyenne nulle, son carré de moyenne 1/2.
Notes et références
modifier- (en) Francisco Javier Garcia Capitan, « Means as Chords », Forum Geometricorum, vol. 8, , p. 99–101 (ISSN 1534-1178)
- (fr)Fabrice Mazerolle, « Moyenne Arithmétique », (consulté le )
- Stella Baruk, « Moyenne », Dictionnaire de mathématiques élémentaires, Éditions du Seuil, 1995.
- (en) Mowaffaq Hajja, « Some Elementary Aspects of Means », International Journal of Mathematics and Mathematical Sciences, vol. 2013, (lire en ligne)
- (en) Frank Deutsch, Best Approximations in Inner Product Spaces, Springer-Verlag, (lire en ligne), « 2. Best Approximation »
- (en) Frank Nielsen et Rajendra Bhatia, Matrix Information Geometry, Springer, (ISBN 9783642302329, lire en ligne), p. 171.
- (it) O. Chisini, « Sul concetto de media », Periodico di Matematiche, vol. 9, no 4,
- (en) Edward L. Dodd, « The Substitutive Mean and Certain Subclasses of this General Mean », Ann. Math. Statist., vol. 11, no 2, , p. 163-176 (DOI 10.1214/aoms/1177731910)
- (en) David Farnsworth et Richard Orr, « Gini Means », The American Mathematical Monthly, vol. 93, no 8, , p. 603-607 (DOI 10.1080/00029890.1986.11971898, lire en ligne)
- J.B. Hiriart-Urruty, « Il y a encore du TAF », Losanges, , p. 41 (lire en ligne )
- (en) Handbook of means and their inequalities, Springer, .
- (en) Horst Alzer et Stephan Ruscheweyh, « On the intersection of two-parameter mean value families », Proceedings of the American Mathematical Society, vol. 129, no 9, , p. 2655–2662 (lire en ligne)
- (en) Kenneth B. Stolarsky, « Generalizations of the Logarithmic Mean », Mathematics Magazine, vol. 48, no 2, , p. 87–92 (DOI 10.1080/0025570X.1975.11976447)
- (en) Alfred Witkowski, « On Seiffert-like means », Journal of Mathematical Inequalities, vol. 9, no 4, , p. 1071–1092 (DOI 10.7153/jmi-09-83, lire en ligne)
- (en) Hongwei Chen, « Means Generated by an Integral », Mathematics Magazine, vol. 78, no 5, , p. 397-399 (DOI 10.2307/30044201)
Voir aussi
modifierBibliographie
modifier- Charles Antoine, Les Moyennes, Paris : PUF, coll. Que sais-je ? (no 3383), 1998.
- Charles Antoine, « Moyenne selon une loi de composition » in Mathématiques et sciences humaines (EHESS)
- (en) Mabrock K. Faradj, Which mean do you mean?: an exposition on means, LSU Master's Theses, (lire en ligne)
Articles connexes
modifier- Statistiques élémentaires : Critères de position
- écart-type
- Incertitude et décimales significatives