Mathématique m1412

La médiane

​​​​​Afin de faciliter certaines représentations graphique d'une distribution, il arrive que la médiane soit utilisée comme point de référence. Pour s'en servir de cette façon, il faut être en mesure de la calculer et ce, peu importe la nature de la distribution. 

Dans un cas comme dans l'autre, la médiane garde la même définition.

La médiane est la mesure de tendance centrale qui indique le centre de la série de données. En d'autres mots, c'est la valeur qui sépare une distribution ordonnée en deux groupes qui contiennent le même nombre de données.

Selon cette définition, on pourrait se contenter de compter le nombre total de données d'une distribution pour ensuite identifier celle qui est au centre. Par contre, il existe quelques cas particuliers pour lesquels une formule est de mise.

Si une série compte |n| données, alors le rang de la donnée médiane sera :

|\text{Rang de la médiane} = \left( \frac{n+1}{2} \right)^\text{e}| donnée.

Deux cas peuvent survenir :

1. Si |n| est un nombre impair, alors |\frac{n+1}{2}| sera un nombre entier et on pourra aller chercher directement la médiane.

2. Si |n| est un nombre pair, alors |\frac{n+1}{2}| sera un nombre décimal. Dans ce cas, on détermine la médiane en faisant la moyenne des données centrales de la distribution.

​​Afin de mieux comprendre la mise en application de cette formule, voyons comment elle peut être appliquée dans des distributions de différentes natures.

Médiane dans une distribution de​ données non regroupées

Comme mentionné dans la formule, calculer la médiane est un processus qui est différent selon le nombre de données contenues dans la distribution. 

Nombre impair de données
Soit le nombre de kilomètres parcourus par jour par Victor donné ci-dessous, détermine la valeur de la médiane.

192, 196, 134, 185, 201, 188,​ 197. 

1) Ordonner la distribution (placer en ordre croissant)
134, 185, 188, 192, 196, 197, 201. 

2) Identifier la donnée qui sépare la distribution en 2 groupes égaux

Puisqu’il y a 3 données avant et 3 données après 192, alors 192 est la médiane.

En utilisant la formule avec |n=7|, on trouve :

|\text{Rang de la médiane} = \left( \frac{7+1}{2} \right)^\text{e} = 4^\text{e}| donnée.

En retournant analyser la distribution ordonnée, on identifie celle qui est en 4​​e position, soit 192. ​

Si la distribution possède un nombre pair de données, la démarche de calculs est un peu différente.​

Nombre pair de données
Lors de son voyage, Victor est parti 8 jours plutôt que 7. Selon la distribution suivante, détermine la valeur de la médiane.

192, 196, 134, 185, 201, 188,​ 197, 199. 

1) Ordonner la distribution (placer en ordre croissant)
134, 185, 188, 192, 196 , 197, 199, 201. 

2) Identifier la donnée qui sépare la distribution en 2 groupes égaux

Avec un nombre pair de données, on voit qu'il faudrait séparer la distribution entre 192 et 196 pour que chacun des 2 groupes ainsi formés soient égaux. Par convention, on fait la moyenne de ces deux données pour obtenir la valeur estimée de la médiane.

|\frac{192+196}{2}=194| 

En utilisant la formule pour une distribution contenant 8 données (|n=8|), on obtient :

|\text{Rang de la médiane} = \left(\frac{8+1}{2}\right)^\text{e} = 4,5^\text{e}| donnée.

Concrètement, la 4,5e donnée est obtenue en faisant la moyenne entre la 4donnée (192) et la 5​e donnée (196). 
|\frac{192+196}{2}=194| ​

Ici, la médiane ne fait pas partie de la distribution, mais il faut garder à l'esprit que la médiane sert seulement à identifier le milieu de la distribution. Ainsi, il n'y a aucune spécification quant au fait que la médiane doit être une donnée faisant partie intégrante de la distribution.​

​Médiane dans une distribution de données condensées

Dans ce cas, la médiane est associée à la valeur située au milieu de l'effectif.

Nombre impair de données
Soit la distribution de données condensées suivante, quelle est la médiane?

Valeur Effectif
16
212
35
42
Total25
 
1) On applique la formule pour trouver la position de la médiane.

|\text{Rang de la médiane}=\left(\frac{n+1}{2}\right)^\text{e}=\left(\frac{25+1}{2}\right)^\text{e}=13^\text{e}| donnée

Donc, la médiane est la 13e donnée de la distribution ordonnée.

2) On additionne les effectifs (effectif cumulé) à partir du début jusqu'à ce que l'on dépasse ou égalise la valeur de la position de la médiane.

Valeur Effectif Effectif
cumulé
166
21218
3523
4225
Total25
 
Avec l'effectif cumulé, on peut déduire que les 6 premières données de la distribution sont 1, que les données situées entre la 7e et la 18e position sont 2 et ainsi de suite. Selon le calcul, on veut la 13e donnée, ce qui correspond à la valeur 2 puisque la 13e donnée est située entre la 7e et la 18e position. 

Ainsi, la médiane est 2.

Une fois de plus, il faut porter une attention particulière aux distributions avec un nombre pair de données.

Nombre pair de données
Soit la distribution de données suivante, quelle est la médiane?
m1412 - 10.PNG
1) On applique la formule pour trouver la position de la médiane.

|\text{R​ang de la médiane} = \left( \frac{50+1}{2} \right)^\text{e} = 25,5^\text{e}| donnée

Donc, la médiane correspond à la moyenne entre la 25e et la 26e donnée.

2) On additionne les effectifs (effectif cumulé) à partir du début jusqu'à ce que l'on trouve où se situe les deux données recherchées.
m1412 - 11.PNG
Selon l'effectif cumulée, on voit que la valeur 2 est associée aux positions 10 à 25 inclusivement, Donc, la 25e donnée vaut 2. Dans le même ordre d'idée, on peut associer la valeur 3 aux positions 26 à 44 inclusivement. Ainsi, la 26e donnée vaut 3. Finalement, on calcule la moyenne de ces deux données:

|\frac{2+3}{2} = 2,5|.

Donc, la médiane de cette distribution est 2,5.

Médiane dans une distribution de données groupées en classes

Pour une distribution de données groupées en classes, la classe comportant la médiane est appelée classe médiane. Pour une estimation de la valeur médiane, il suffit de déterminer le milieu de la classe médiane.

Nombre impair de données
Soit la distribution de données groupées en classes suivante, quelle est la médiane?
m1412i14.PNG
1) On applique la formule pour trouver la position de la médiane.

|\text{Rang de la médiane}=\left(\frac{n+1}{2}\right)^\text{e}=\left(\frac{41+1}{2}\right)^\text{e}=21^\text{e}| donnée

Ce qui signifie que la médiane se situe exactement à la 21e position de la distribution ordonnée. 

2) On additionne les effectifs (effectif cumulé) à partir du début jusqu'à ce que l'on dépasse ou égalise la valeur de la position de la médiane. 

​​m1412 - 12.PNG
Selon la colonne de l'effectif cumulé, on déduit que la donnée qui est en 21e position se situe entre les 20e et 27e​ positions, soit dans l'intervalle [20 , 30[. Donc, la classe médiane est [20 , 30[, mais l'estimation de la donnée médiane est:

|\text{Valeur médiane estimée} = \frac{20 + 30}{2} = 25|.​

Une fois de plus, il faut être à l'aise avec l'interprétation d'un tel tableau lorsque le nombre de données de la distribution correspond à un nombre pair.

Nombre pair de données

Soit la distribution de données groupées en classes suivante, quelle est la médiane?

Classe Effectif
[0,5[32
[5,10[28
[10,15[41
[15,20[23
Total124


1) On applique la formule pour trouver la position de la médiane.

|\text{Rang de la médiane}=\left(\frac{n+1}{2}\right)^\text{e}=\left(\frac{124+1}{2}\right)^\text{e}=62,5^\text{e}| donnée

Ce qui signifie que la médiane se situe entre les 62e et 63e données de la distribution ordonnée. 

2) On additionne les effectifs (effectif cumulé) à partir du début jusqu'à ce que l'on dépasse ou égalise la valeur de la position de la médiane.

Classe Effectif Effectif cumulé
[0,5[3232
[5,10[2860
[10,15[41101
[15,20[23124
Total124


Dans cet exemple, la 62et la 63e données sont situées dans le même intervalle, soit [10 , 15[. Ainsi, la classe médiane est [10 , 15[, mais la donnée médiane estimée correspond à la valeur se situant au milieu de cet intervalle:

|\text{Valeur médiane estimée} = \frac{10 + 15}{2} = 12,5|.

Bien entendu, il est difficile de tirer des conclusions suite à l'analyse d'une distribution seulement selon sa médiane. Or, elle aide à apporter des nuances aux autres mesures de tendance centrale puisqu'elle ne tient pas compte des données aberrantes.

Les vidéos
Les exercices
Les références