Mathématique m1362

Les méthodes d'échantillonnage

​​​​​​​​​​​Lorsqu’on souhaite effectuer un sondage ou une enquête, il n’est pas toujours possible d’interroger chaque membre de la population de par des contraintes géographiques, monétaires ou temporelles. Par contre, il est tout de même possible d’en apprendre plus à propos de la population visée notamment en analysant un échantillon. Pour ce faire, il est primordial de choisir la bonne méthode de construction d'un tel échantillon.

​Concepts de base

La population et l'inventaire sont respectivement le groupe formé par toutes les personnes ou les objets à propos duquel on souhaite obtenir de l’information.

Un échantillon est un sous-groupe de personnes ou d'objets faisant partie de la population ou de l'inventaire.

Un échantillon est dit représentatif quand il représente la population ou l'inventaire le plus fidèlement possible de par ses caractéristiques et sa quantité.

Voici un schéma qui illustre bien la différence entre chacun de ces termes:

m1362-10.PNG

Des scientifiques s’intéressent au mouvement migratoire du Fou de bassan du Québec. Par contre, ils ne peuvent pas observer chacun des oiseaux de cette espèce. Or, les scientifiques peuvent en attraper quelques-uns (échantillon représentatif), leur poser des puces électroniques et analyser leurs déplacements. Ainsi, ils peuvent généraliser les comportements de ces quelques oiseaux à tous ceux de leur espèce.

Il est nécessaire d'identifier le plus précisément possible la population ciblée avant d’effectuer la recherche d’informations. Dans le cas contraire, on risque d’obtenir des résultats qui ne correspondent pas à ce qu’on recherche.

Choisir une méthode d'échantillonnage

Bien que le recensement soit la meilleure manière d'obtenir les informations les plus fidèles d'une population, on procèdera très souvent à un sondage. Voici quelques raisons d'effectuer un sondage au lieu d'un recensement:

  • Lorsque la population est trop grande puisque cela engendre moins de dépenses monétaires (transport, temps, employés, etc.)

  • Lorsqu'on ne bénéficie pas de beaucoup de temps

  • Lorsque la population ciblée est difficilement accessible

​Par ailleurs, il existe plusieurs méthodes permettant de créer un échantillon dans une population. En fonction du contexte et des besoins de l'étude, chaque méthode a ses avantages et ses inconvénients.

Aléatoire (ou aléatoire simple)

Chaque personne ou objet de la population a la même probabilité de faire partie de l’échantillon puisqu'ils sont tous pigés au hasard.

On souhaite évaluer la satisfaction des étudiants d’une université qui en compte 30 000 (population) à propos de la propreté générale du campus. Pour ce faire, on décide de construire un échantillon de 2000 étudiants par la méthode d’échantillonnage aléatoire. Ainsi, un ordinateur choisit au hasard le nom de 20​00 d'entre eux.

​De façon plus générale, cette méthode présente un avantage et un inconvénient majeurs.

Avantage
  • De par les différentes lois en probabilité, cet échantillon sera représentatif de la population.

Inconvénient

  • Il faut avoir la liste complète de la population pour ensuite faire le tirage au sort.

​​Systématique

Chaque élément qui compose l'échantillon est choisi de façon régulière, selon un intervalle régulier, à l'intérieur de la population ciblée.

Pour vérifier la qualité du produit (inventaire ciblé) créé par une chaîne de montage dans une usine, on en analyse un à chaque 100 (échantillon) qui sortent de la ligne de production.

Tout comme la méthode précédente, on peut dégager les principaux avantages et inconvénients d'une telle méthode de sélection.

Avantage​​s

  • On peut facilement prédéterminer la taille et les éléments faisant partie de l'échantillon.

  • L'échantillon est distribué dans des proportions égales dans la population.

​Inconvénient

  • De par sa caractéristique d'intervalles réguliers pour choisir les éléments​, cela ne garantit pas un échantillon représentatif​.

Par grappes

En se basant sur la position géographique de la population ciblée, on la divise d'abord en grappes (sous-groupes de la population) pour ensuite en sélectionner un certain nombre de façon aléatoire afin de former l'échantillon.

Une étudiante au doctorat effectue une recherche sur la satisfaction des élèves québécois au secondaire (population) par rapport à la qualité de la nourriture offerte dans leur cafétéria. Puisqu'il est irréaliste d'envoyer un questionnaire à chaque adolescent fréquentant une école secondaire au Québec, elle choisit aléatoirement un certain nombre d’écoles (grappes) auxquelles elle envoie un questionnaire à chaque élève (échantillon).

Malgré son application à l'air plutôt simpliste, il n'en demeure pas moins que cette méthode possède des bons et des mauvais côtés.

Avantage​​s​

  • Il n'est pas nécessaire d'avoir une liste officielle de tous les membres de la population ciblée.

  • Idéal pour sonder une population qui est géographiquement étendue.

​Inconvénients

  • Généralement, les éléments d'une même grappe possèdent des caractéristiques semblables sans nécessairement être celles de la population ciblée.

  • ​Il est très difficile de prédire la taille de l'échantillon étant donné que les grappes n'ont pas toutes la même quantité d'individus.

Stratifié

En se basant sur une caractéristique de la population ciblée, on la divise d'abord en strates (sous-groupes de la population) pour ensuite sélectionner de façon aléatoire des membres de chacune des strates en respectant leur proportionnalité dans la population.

Pour conserver cette proportionnalité, on peut avoir recours à l'équalité suivante:

|\displaystyle \frac{\text{Nombre de membres à prendre dans cette strate}}{\text{Taille de l'échantillon}} = \displaystyle \frac{\text{Taille de la strate}}{\text{Taille de la population}}|

​Concrètement, voici comment on peut procéder pour construire un échantillon en utilisant la méthode d'échantillonnage par strates.

Dans un quartier qui compte cinq rues, le conseiller municipal veut avoir des informations relatives à la localisation des arrêts d'autobus. Pour y arriver, il décide de prélever un échantillon aléatoire de 100 résidents (adultes) parmi la population suivante:

Pour respecter les critères d'un échantillonnage stratifié, il calcule les proportions suivantes:

Rue Des Tulipes :
|\displaystyle \frac{75}{500} = \displaystyle \frac{?}{100}|
|? = 15| résidents de la rue Des Tulipes.

Rue Des Lilas :
|\displaystyle \frac{75}{500} = \displaystyle \frac{?}{100}|
|? = 15| résidents de la rue Des Lilas.

Rue Des Rosiers :
|\displaystyle \frac{200}{500} = \displaystyle \frac{?}{100}|
|? = 40| résidents de la rue Des Rosiers.

Rue Des Vivaces :
|\displaystyle \frac{100}{500} = \displaystyle \frac{?}{100}|
|? = 20| résidents de la rue Des Vivaces.

Rue Des Marguerites :
|\displaystyle \frac{50}{500} = \displaystyle \frac{?}{100}|
|? = 10| résidents de la rue Des Marguerites.

Au total, |15+15+40+20+10 = 100| résidents du quartier seront interrogés.

À la lumière de cet exemple, on peut déduire quelques avantages et inconvénients en lien avec cette méthode d'échantillonnage.​

Avantage​​

  • Cette méthode assure une assez bonne représentativité de la population dû à son critère de proportionnalité.

​Inconvénient

  • ​Il faut avoir une bonne connaissance de la population afin d'établir les strates avec lesquelles il faudra travailler.


Choisir un échantillon représentatif

Pour qu’on puisse considérer qu’un échantillon soit représentatif d’une population, il doit posséder les caractéristiques suivantes :

  • Être d'une taille suffisante par rapport à la population

  • Posséder les mêmes caractéristiques que la population

​Un chercheur souhaite évaluer le nombre d’heures que les élèves des écoles secondaire du Québec (population) passent devant leur ordinateur. Donc, il décide d’interroger une classe d'élèves de deuxième secondaire d’une école de Montréal (échantillon) à ce sujet.

|\bullet| Taille de l'échantillon
Cet échantillon n’est pas représentatif puisque la population ciblée est tous les ​​​élèves québécois de niveau secondaire, soit environ 320 000 adolescents. Par contre, l'échantillon contient seulement des élèves d'une classe, soit environ 30 adolescents.

|\bullet| Caractéristiques de l'échantillon versus celles de la population
Dans la population, ce sont tous les élèves des écoles secondaires de la province de Québec qui sont considérés. En d'autres mots, il faudrait que l'échantillon contienne des écoles de différentes régions et des élèves des différentes années du parcours secondaire.

Outre ces de​​ux caractéristiques, il existe plusieurs autres facteurs qui aident à déterminer si un échantillon est représentatif ou non. Par contre, ces critères sortent du cadre de l'enseignement secondaire. Pour les plus curieux, voici une piste d'informations à ce sujet.

Représentativité d'un échantillon

Comme plusieurs concepts en mathématique, on peut déterminer si la taille d'un échantillon est représentatif à l'aide de formules et de représentations graphiques. Pour ce faire, plusieurs facteurs sont mis en lien comme le taux de réponses attendues, le taux de fiabilité des réponses et la taille de la population. Pour vous aider à comprendre le tout, n'hésitez pas à consulter ce site pour plus de précisions. ​

Les vidéos
Les exercices
Les références