Mathématique m1366

Les diagrammes de quartiles

​​​​​​Le diagramme de quartiles permet d’obtenir d’un seul coup d’œil plusieurs informations à propos de la dispersion des données d’un ensemble. Entre autres, il montre les données éloignées, les données minimale et maximale, la médiane et les quartiles d’un ensemble de données. De plus, ce type de diagramme permet d’évaluer facilement la symétrie (ou l'asymétrie) d’une distribution.

La construction du diagramme de quartiles

Pour construire un diagramme de quartiles, il faut déterminer la valeur de certains éléments de la distribution. D'un autre côté, il se peut qu'il y ait des données qui ne soient pas représentatives du groupe. Dans ce cas, il est préférable de ne pas les considérer.

Une donnée éloignée (aberrante)​​ est une valeur de la distribution qui est inférieure à |1,5| fois l'étendue interquartile par rapport à |Q_1| ou qui est supérieure à |1,5| fois l'étendue interquartile par rapport à |Q_3|.

Mathématiquement parlant, une donnée |x| est aberrante si:

|x < Q_1 - 1,5(Q_3-Q_1)| ou si |x > Q_3+1,5(Q_3-Q_1)|.

Pour mieux identifier ces données, il est préférable de construire le diagramme de quartiles associé à la distribution avec laquelle on travaille.


Étapes pour tracer un diagramme de quartiles

Afin que les diagrammes de quartiles de toutes situations soient semblables, il y a certains éléments à respecter.

Tracer le diagramme de quartiles correspondant à l’ensemble de données suivantes :
 
|12, 15, 16, 18, 19, 22, 26, 27, 29, 30, 31, 36, 38|

1) Placer les données en ordre croissant
Dans le cas présent, les données sont déjà placés dans cet ordre.

2) Trouver la valeur de |Q_2| (la médiane)
Puisqu'il y a un nombre impair de données (|13|), la médiane se trouve à la |(13 + 1) \div 2 =| 7e donnée.

Dans cette distribution, la 7e donnée est |26|.

3) Trouver la valeur de |Q_1|
Selon la première moitié de la distribution, la valeur du premier quartile correspond à la médiane du sous-ensemble suivant: 
|12, 15, 16, 18, 19, 22|

Puisqu'il contient |6| données, la médiane est la |(6 + 1)  \div  2 = | 3,5​e donnée. En d'autres mots, il faut faire la moyenne entre la 3e (|16|) et la 4e donnée(|18|). Ainsi, on obtient |((16 + 18) \div 2) = 17|.
Donc, |Q_1 = 17|. 

4) Trouver la valeur de |Q_3|
Selon la deuxième moitié de la distribution, la valeur du troisième quartile correspond à la médiane du sous-ensemble suivant: 
|27, 29, 30, 31, 36, 38|

​Puisqu'il contient |6| données, la médiane est la |(6 + 1)  \div  2 = | 3,5​e donnée. En d'autres mots, il faut faire la moyenne entre la 3e (|30|) et la 4e donnée(|31|). Ainsi, on obtient
|((30 + 31) \div 2) = 30,5|​

Donc, |Q_3 = 30,5|.

5) Identifier s'il y a des données éloignées
Pour ce faire, on calcule d'abord l’étendue interquartile qui est
|Q_3- Q_1= 30,5 – 17 = 13,5|

Ensuite, on vérifie si certaines données sont inférieures à
|Q_1 – 1,5 (Q_3 – Q_1) = 17 - 1,5(13,5) = 17 - 20,25 = -3,25 |. 

Dans cet exemple, aucune donnée de la distribution initiale n’est inférieure à| –3,25|.
 
Par la suite, on vérifie si certaines données sont supérieures à
|Q_3+ 1,5 (Q_3– Q_1) = 30,5 + 1,5(13,5) = 30,5 + 20,25 =  50,75|.

Une fois de plus, aucune donnée de la distribution initiale n’est supérieure à |50,75|.
 
6) Tracer le diagramme
Tous les éléments nécessaires ayant été trouvés, on peut tracer le diagramme de quartiles ​​: 
m1366 - 10.PNG

Fait à noter, il n'est pas essentiel d'identifier textuellement les valeurs minimale, maximale ainsi que celles des quartiles. Dans cet exemple, elles ont été identifiées de le but de faciliter la compréhension du diagramme. De plus, un diagramme de quartile doit toujours avoir cette allure avec les cinq lignes verticales pour identifier les différentes mesures de dispersion.

​Par contre, il peut arriver que la distribution contienne des données éloignées. Si c'est le cas, le diagramme de quartiles subira quelques modifications.

Tracer un diagramme de quartiles avec une donnée éloignée

Tracer le diagramme de quartiles correspondant à l’ensemble de données suivantes :

|12, 15, 16, 18, 19, 22, 26, 27, 29, 30, 31, 36, 55|

1) Placer les données en ordre croissant

Dans le cas présent, les données sont déjà placés dans cet ordre.

2) Trouver la valeur de |Q_2| (la médiane)

Puisqu'il y a un nombre impair de données (|13|), la médiane se trouve à la |(13 + 1) \div 2 =| 7​e donnée. 

Dans cette distribution, la 7e donnée est |26|. 

3) Trouver la valeur de |Q_1|

Selon la première moitié de la distribution, la valeur du premier quartile correspond à la médiane du sous-ensemble suivant: 

|12, 15, 16, 18, 19, 22| 

Puisqu'il contient |6| données, la médiane est la |(6 + 1)  \div  2 = | 3,5​​e donnée. En d'autres mots, il faut faire la moyenne entre la 3e​​ (|16|) et la 4e donnée(|18|). Ainsi, on obtient |((16 + 18) \div 2) = 17|. 

Donc, |Q_1 = 17|. 

4) Trouver la valeur de |Q_3|

Selon la deuxième moitié de la distribution, la valeur du troisième quartile correspond à la médiane du sous-ensemble suivant: 

|27, 29, 30, 31, 36, 55| 

Puisqu'il contient |6| données, la médiane est la |(6 + 1)  \div  2 = | 3,5e donnée. En d'autres mots, il faut faire la moyenne entre la 3e (|30|) et la 4e donnée(|31|). Ainsi, on obtient |((30 + 31) \div 2) = 30,5|. 

Donc, |Q_3 = 30,5|.

5) Identifier s'il y a des données éloignées

Pour ce faire, on calcule d'abord l’étendue interquartile qui est égale à |Q_3- Q_1= 30,5 – 17 = 13,5|. 

Ensuite, on vérifie si certaines données sont inférieures à

|Q_1 – 1,5 (Q_3 – Q_1) = 17 - 1,5(13,5) = 17 - 20,25 = -3,25 |. 

Dans cet exemple, aucune donnée de la distribution initiale n’est inférieure à| –3,25|.

Par la suite, on vérifie si certaines données sont supérieures à 

|Q_3+ 1,5 (Q_3– Q_1) = 30,5 + 1,5(13,5) = 30,5 + 20,25 =  50,75|. 

Puisque |55 > 50,75|, alors |55| est une donnée éloignée.

6) Tracer le diagramme

Dans ce cas, les données éloignées doivent être identifiées avec un astérisque. De plus, la valeur maximale ne sera plus 55, mais la dernière valeur qui n'est pas considérée comme éloignée, soit 36.

Ainsi, l'allure du diagramme de quartiles est:​


m1366i16.PNG

​​Une règle bien importante à respecter est qu'il ne faut jamais délibérément éliminer une donnée d'une enquête. Même si on ne tiendra pas compte de cette donnée éloignée pour interpréter le diagramme, il est important de signifier sa présence afin de conserver une certaine crédibilité.

L’interprétation d’un diagramme de quartiles

​Compte tenu du fait qu’il doit y avoir le même nombre de données dans chaque quart, une boîte allongée ou une longue tige indique que les données sont dispersées. Si, au contraire, la boîte ou la tige est courte, cela signifie qu’il n’y a pas un grand écart entre les données. Ainsi, des entreprises ou des groupes d'individus peuvent prendre des décisions plus éclairées afin d'accéder à une certaine réussite économique.

Dans le but d'ouvrir une nouvelle boutique de vêtements de sport, on a interrogé un échantillon d'une population sur la somme que chaque individu serait prêt à débourser pour un morceau de vêtement de qualité supérieure. 

Pour faciliter l'interprétation des données amassées, on a construit le diagramme de quartiles suivant:
m1366 - 12.PNG
Selon ce diagramme, on peut établir que 75% des gens (ceux faisant partie des 2e, 3e et 4e quarts) s'attendent à débourser entre 30$ et 54$ pour un article.

Ainsi, la future entreprise devra garder cette information en mémoire afin de ne pas vendre ses produits trop chers.

​Peu importe l'allure du diagramme de quartiles, il est important de se rappeler la proportion représentée par chaque quart.

Chaque quart du diagramme de quartiles contient 25 % des données.

Par contre, il est important de considérer plus d'un type de mesure afin de tirer des conclusions qui réflètent la réalité. Puisque chaque mesure a ses avantages et ses inconvénients, c'est en considérant un maximum que l'on peut tirer des conclusions satisfaisantes.

On peut ainsi faire un lien avec le rang centile et le rang cinquième. Le premier quart contient les rangs centiles 0 à 25, le deuxième de 25 à 50, le troisième de 50 à 75 et le dernier de 75 à 100. ​

La comparaison de diagrammes de quartiles

Lorsqu’on compare des diagrammes de quartiles, on compare d’abord les médianes (|Q_2|). Ensuite, on peut comparer les longueurs des tiges et des boîtes pour donner un aperçu de la symétrie et de la dispersion des diagrammes.

Comparons ces deux diagrammes de quartiles.​
m1366 - 12(c).PNG
Lorsqu'on compare les médianes, on remarque que les valeurs sont très similaires. Par ailleurs, on peut remarquer que la boîte du diagramme B est plus longue que celle du diagramme A ce qui démontre que les données de la situation B sont plus dispersées que celles de la situation A.

Parfois, on peut résoudre une situation à l'aide d'un diagramme de quartiles.

Voici les résultats, sur un total de 40, des derniers examens de français: 

|12, 15, 16, 18, 19, 22, 26, 27, 29, 30, 31, 36, 38 |

En sachant que le résultat de Marie correspond au |78^\text{e}| rang centile et qu'elle a eu une note inférieure à 36, quel est son résultat?

 m1366 - 14.PNG
Grâce au diagramme de quartiles ci-dessus, on voit que |Q_3| (|75^\text{e}| centile) vaut |30,5|. Donc, le résultat de Marie est entre |30,5| et |36|. Selon ces déductions, il n’y a qu’une réponse possible et c’est |31|.

Ainsi, Marie a obtenu |\frac{31}{40}| à son examen.

Les vidéos
Les exercices
Les références