Mathématique m1376

Le tableau de distribution à double entrée

​​​​Le tableau de distribution à deux caractères est souvent appelé tableau à double entrée ou tableau de corrélation. Il est possible de construire un tel tableau pour tous les types de variables:

​En d'autres mots, un tableau à double entrée sert à représenter l'effectif correspondant à chaque combinaison de valeurs, de modalités ou de classes en lien avec les deux variables étudiées.

​​Malgré son aspect plutôt simpliste, il est important de suivre certaines étapes qui sont cruciales pour obtenir un tableau à double entrée exhaustif. Par ailleurs, le type de variables avec lequel on travaille va avoir un rôle à jouer dans la construction de ces tableaux.

2 données qualitatives​

On demande aux 30 élèves d’une classe de noter la couleur de leur yeux et de leur cheveux. Puisque ces couleurs sont assez standards, chacun doit sélectionner les couleurs appropriées parmi les suivantes :

Pour les cheveux : blonds, châtains, bruns, noirs, roux.
Pour les yeux : bleus, verts, bruns.

Après compilation, on obtient ces résultats :

(blonds, bleus); (blonds, bleus); (blonds, verts); (blonds, bruns) ; (châtains, bleus); (châtains, bleus); (châtains, bleus); (châtains, bleus); (châtains, bleus); (châtains, verts); (châtains, bruns); (châtains, bruns); (châtains, bruns); (châtains, bruns); (châtains, bruns); (bruns, bleus); (bruns, bleus); (bruns, verts); (bruns, verts); (bruns, bruns); (bruns, bruns); (bruns, bruns); (bruns, bruns); (bruns, bruns); (bruns, bruns); (noirs, bleus); (noirs, verts); (noirs, bruns); (noirs, bruns), (roux, verts).

Construis le tableau à double entrée associée à cette situation.


1) Identifier les variables dépendante et indépendante.
Dans le cas présent, il n'y a aucun lien évident entre les couples de données amassées. Ainsi, il n'y a pas de variables dépendante et indépendante.

2) Au besoin, créer des classes pour regrouper les données.
Une fois de plus, les données qualitatives font en sorte qu'il est impossible de créer des classes pour regrouper les données.

3) On place le premier groupe de modalités dans la première colonne (variable indépendante) et le deuxième groupe de modalités dans la première ligne (variable dépendante).


m1376 - 10.PNG

Fait à noter, on peut ajouter une ligne et une colonne intitulées "total" afin de faciliter l'interprétation de l'enquête. De plus, puisque que le critère de dépendance n'est pas mis en cause, on aurait pu intervertir la première ligne et la première colonne sans en modifier les interprétations finales.


4) On compile chacun des couples de données.
m1376 - 11.PNG

Par exemple, le chiffre "5" à l'intersection de la ligne "bleus" et de la colonne "châtains" signifie qu'il y a 5 élèves qui ont les cheveux châtains et les yeux bleus.

En fait, il est plus simple de travailler avec des variables de type qualitatif puisqu'il n'y a pas de classes à créer. Par contre, la tâche est légèrement plus imposante lorsque l'enquête renferme des données quantitatives.

2 données quantitatives
Chaque jour du mois de mai, on mesure la température maximale de la journée en degrés Celsius et la quantité de pluie tombée en millimètres.

m1376 - 12.PNG

Construis le tableau à double entrée associée à cette situation.

1) Identifier les variables dépendante et indépendante. 

Dans le cas présent, il n'y a aucun lien évident entre la température et la quantité de pluie tombée.


2) Au besoin, créer des classes pour regrouper les données.
Pour alléger le tableau, on peut créer des classes pour chacune des variables.

Concernant la température, les données varient entre |5^\circ C| et |22^\circ C|​. Ainsi, on peut décider de créer les classes suivantes:

[5, 10[ ; [10, 15[ ; [15, 20[ ; [20, 25[.

Concernant la quantité de pluie, elle varie de 0 mm à 19 mm. Donc, on peut décider de créer les classes suivantes:

[0, 5[; [5, 10[; [10, 15[ ; [15, 20[


3) On place le premier groupe de valeurs dans la première colonne (variable indépendante); et le deuxième groupe de valeurs dans la première ligne (variable dépendante).​

m1376i22.PNG 

Fait à noter, on peut ajouter une ligne et une colonne intitulées "total" afin de faciliter l'interprétation de l'enquête. De plus, puisque que le critère de dépendance n'est pas mis en cause, on aurait pu intervertir la première ligne et la première colonne sans en modifier les interprétations finales.

4) On compile chacun des couples de données.

m1376i21.PNG 

Par exemple, le nombre 11 à l'intersection de la ligne "[0, 5[" et de la colonne "[10, 15[" signifie qu'il y a eu 11 jours où il est tombé entre 0 mm (inclus) et 5 mm (exclu) de pluie et où la température se situe entre |10^\circ C| (inclus) et |15^\circ C|  (exclu).

Finalement, on peut mélanger les types de variables avec lesquels on travaille.

1 variable quantitative et 1 variable qualitative
​On demande à 30 cyclistes de calculer leur nombre de kilomètres parcourus par jour en fonction des conditions météorologiques. Suite à la réalisation de l'enquête, on a obtenu les couples de réponses suivants:

(ciel variable, 50) ; (ensoleillé, 120) ; (ensoleillé, 148) ; (nuageux, 42) ; (pluie, 0) ; (pluie, 25) ; (ciel variable, 43) ; (ensoleillé, 114) ; (nuageux, 54) ; (pluie, 34) ; (ciel variable, 61) ; (nuageux, 69) ; (nuageux, 59) ; (nuageux, 71) ; (pluie, 32) ; (ciel variable, 54) ; (ensoleillé, 109) ; (ciel variable, 74) ; (pluie, 42) ; (nuageux, 72) ; (ensoleillé, 87) ; (ciel variable, 122) ; (nuageux, 83) ; (ensoleillé, 86) ; (pluie, 69) ; (ciel variable, 43) ; (nuageux, 0) ; (nuageux, 98) ; (ensoleillé, 56) ; (pluie, 86)

Construis le tableau à double entrée associée à cette situation.

1) Identifier les variables dépendante et indépendante.
Dans cette situation, on peut déduire que la température aura un impact sur le nomber de kilomètres parcourus par les cyclistes. Ainsi, on peut associer la température à la variable indépendante et le nombre de kilomètres à la variable dépendante.

2) Au besoin, créer des classes pour regrouper les données.
Au niveau de la température, il n'y a aucune classe à créer. Par contre, on peut classer le nombre de kilomètres parcourus de la façon suivante:

[0, 30[ ; [30, 60[ ; [60, 90[ ; [90, 120[ ; [120, 150[

3) On place le premier groupe de modalités dans la première colonne (variable indépendante) et le deuxième groupe de valeurs dans la première ligne (variable dépendante).
En tenant compte des variables indépendante et dépendante, on obtient le tableau suivant:
m1376 - 15.PNG
4) On compile chacun des couples de données.
m1376 - 16.PNG

À partir de ces tableaux, on peut plus facilement calculer des probabilités conditionnellesdes fréquences relatives et estimer la corrélation puisque les données sont organisées.​

Les vidéos
Les exercices
Les références