Mathématique m1507

La variance

​​En ce qui concerne la variance, elle est une des mesures les plus utilisées et les plus fiables quand vient le temps d'analyser les données d'une distribution. En la comparant avec la moyenne, un esprit averti peut reconnaître la présence de données aberrantes ou éloignées.

La variance, habituellement notée |s^2| ou |\sigma^2|, est définie comme la moyenne du carré des écarts à la moyenne des valeurs de la distribution. 

Le calcul de la variance est nécessaire pour calculer l'écart type.

Peu importe s'il s'agit d'une population ou d'un échantillon, la variance se calcule en suivant une démarche très similaire, soit à un détail près.

|s^{2}=\frac{\sum(x_{i}-\overline{x})^{2}}{n-1}| ou |\sigma^2 = \frac{\sum (x_i-\mu)^2}{N}|


|\sum| est un symbole qui signifie qu’il faut effectuer une somme.

|x_i| représente la |i^\text{e}| valeur de la distribution.

|\overline{x}| représente la moyenne de l’échantillon et |\mu| représente la moyenne d'une population.

|n| représente la taille de l’échantillon et |N| la taille de la population.

Note : Si on travaille avec un échantillon, on utilise la formule pour |s^2| alors qu'avec une population, on utilise la formule pour |\sigma^2|.

​Afin de bien comprendre toutes les complexités de cette formule, voici un exemple de calcul de la variance d'un échantillon.

Calculer la variance de la distribution suivante qui a été construite avec des données (en degrés Celcius) amassées à chaque heure durant une journée.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.


1) Échantillon ou population?

Dans ce cas, il est question d'un échantillon puisqu'il y a eu des moments durant la journée où la température n'a pas été notée. Ainsi, on utilisera la formule avec |s^2|, |n|, et |\overline{x}|.


2) Déterminer la taille de la distribution

Puisqu'il y a 24 heures dans une journée, cette distribution doit contenir 24 données.


3) Calcul de la moyenne de la distribution

En se fiant à la définition de la moyenne arithmétique, on obtient que |\overline{x} \approx 3,29 ^\circ \text{C}|


4) Calcul de la somme du carré des écarts à la moyenne

Voici le calcul du carré des écarts à la moyenne.

|x_{i}| |\left(x_{i}-\overline{x}\right)^{2}|​
-5|\left((-5)- 3,29\right)^2\approx 68,72|
-4|\left((-4) - 3,29 \right)^2 \approx 53,14|
-453,14
-339,56
-339,56
-227,98
-118,40
010,82
010,82
15,24
21,66
30,08
30,08
40,50
40,50
67,34
713,76
822,18
932,60
1045,02
1045,02
1159,44
1159,44
1275,86
​Somme​690,86

5) Calcul de la variance

Puisqu'il est question d'un échantillon, il faut diviser par |n-1 = 24 - 1 = 23|. Ainsi,

|s^2= \frac{\sum(x_i-\overline{x})^2}{n-1} = \frac{690,86}{23} \approx 30,04|

Ainsi, la variance est d'environ |30,04^\circ \text{C}^2|.

Dû à la présence d'un exposant 2 dans la formule, l'unité de la réponse finale, et non la valeur devant l'unité,  sera toujours élevée à la 2.​

Malgré son calcul en apparence complexe, l'utilité de la variance est plutôt limitée. Concrètement, on l'utilise pour comparer la dispersion des données entre deux distributions différent​es. 

Pour permetter l'étude des données d'une seule distribution, on transformera la variance en écart type​.

Les vidéos
Les exercices
Les références