Méthodes d’échantillonnage aléatoires et non aléatoires

Tirage aléatoire des boules du Loto© Dylan Nolte (Unsplash)

Les résultats d’une enquête par sondage ne sont extrapolables à la population tout entière que si l’échantillon est représentatif. Or cette représentativité est liée à la méthode d’échantillonnage appliquée, probabiliste ou empirique. Quelles sont ces méthodes ?

Cet article aborde un sujet théorique essentiel dans le monde des enquêtes et sondages. Je le traite ici de la façon la plus complète possible mais aussi la plus simple, pour être à la portée de tous :

  1. Les principaux concepts de l’échantillonnage : population, base de sondage, couverture, échantillon, etc.
  2. Représentativité de l’échantillon : peut-on extrapoler les résultats de l’enquête à la population entière ?
  3. Méthodes d’échantillonnage aléatoires : 4 méthodes issues des la théorie des probabilités
  4. Méthodes d’échantillonnage non aléatoires : 4 méthodes empiriques directement applicables


I. Les principaux concepts de l’échantillonnage

Voici un schéma qui présente les principaux concepts à connaître (cette figure est reproduite à partir de l’ouvrage Etudes et analyses marketing dont la 8ème édition est parue chez Pearson en août 2018) :

  1. Population

    La population est l’ensemble des individus auxquels on s’intéresse, autrement dit c’est le groupe entier tel que défini dans les objectifs de l’enquête.

  2. Base de sondage

    La base de sondage disponible pour réaliser l’enquête ne correspond pas toujours exactement à la population. Par exemple, une liste extraite d’un annuaire d’entreprises peut ne pas être exhaustive, ne pas être à jour, contenir des entreprises qui ont fait faillite, etc. Dans certains cas, à défaut de liste, la base de sondage se résume à la série d’hypothèses formulées sur la population, par exemple les consommateurs de café buvant au moins deux tasses par jour.

  3. Erreur de couverture

    L’écart d’adéquation entre la base de sondage et la population entière correspond à l’erreur de couverture.

  4. Échantillon

    L’échantillon est le sous-ensemble de la population sélectionné pour représenter le groupe entier.

  5. Erreur d’échantillonnage

    On appelle erreur d’échantillonnage tout type d’erreur lié à la méthode d’échantillonnage. Dans le schéma ci-dessus, on voit qu’un partie de l’échantillon se trouve à l’extérieur de la population.

  6. Unité d’échantillonnage

    On appelle unité d’échantillonnage l’unité de base de l’enquête. Le plus souvent il s’agit de l’individu qui répond à l’enquête mais il peut aussi s’agir d’un foyer familial ou d’une entreprise.


II. Représentativité de l’échantillon

L’essentiel à retenir, c’est que les résultats obtenus sur l’échantillon ne sont extrapolables à la population entière que si l’échantillon est représentatif.

Or la représentativité de l’échantillon dépend essentiellement de la méthode d’échantillonnage adoptée :

En théorie, seul un échantillonnage aléatoire, aussi appelé probabiliste, car il repose sur la théorie des probabilités, permet d’obtenir des résultats représentatifs. Ceci sous réserve de l’absence d’autres biais comme par exemple l’erreur de couverture vue précédemment.

En pratique, comme le recours aux méthodes de sondage aléatoire est difficile à mettre en œuvre et requiert en général l’intervention d’un spécialiste, on se tourne le plus souvent vers une méthode de sondage empirique comme par exemple la méthode des quotas.

Méthode des quotas
A LIRE AUSSI

Techniques simples d’échantillonnage
Quels que soient vos objectifs et le type d’enquête à mener, vous allez devoir définir la population cible à interroger et vous chercherez à constituer un échantillon tiré de la base de sondage. En pratique, on choisira souvent une méthode […] Lire la suite


III. Méthodes d’échantillonnage aléatoires

Ces méthodes supposent qu’on dispose d’une base de sondage correspondant à la population étudiée (et aussi, ne l’oubliez pas, que toutes les unités de l’échantillon constitué répondent effectivement à l’enquête).

Si vous n’êtes pas dans ce cas de figure, vous pouvez passer directement aux méthodes non aléatoires.

Examinons ici 4 méthodes d’échantillonnage probabilistes parmi les plus utilisées :

  1. Échantillonnage aléatoire simple

    Le sondeur utilise des nombres sélectionnés de façon aléatoire par un ordinateur, compose des numéros au hasard ou utilise une autre procédure de sélection aléatoire qui garantit que tous les membres de la population de la base de sondage ont la même probabilité de faire partie de l’échantillon. Exemple : le tirage des boules du loto !

  2. Échantillonnage systématique

    Le sondeur s’appuie sur une base de sondage répertoriant les membres de la population pour sélectionner un point de départ aléatoire pour le premier membre de l’échantillon. Pour sélectionner tous les autres membres de l’échantillon, on utilise alors un pas, calculé en divisant le nombre d’unités de la base de sondage par la taille de l’échantillon.

    Vous trouverez la formule de calcul de la taille de l’échantillon en fonction du niveau de confiance souhaité et de la marge d’erreur tolérée dans cet autre article intitulé : Déterminer la taille de l’échantillon.
  3. Échantillonnage par grappes

    La base de sondage est divisée en sous-groupes appelés grappes, qui doivent partager de fortes similarités :

    • le sondeur peut alors sélectionner au hasard quelques grappes pour lesquelles il interroge la totalité des individus (échantillonnage en un degré) ;

    • il peut également choisir davantage de grappes au hasard et constituer des échantillons dans chaque grappe (échantillonnage en deux degrés).

    Cette méthode est à privilégier dans le cas de grappes très similaires pouvant être identifiées facilement, par exemple des espaces géographiques.

  4. Échantillonnage stratifié

    Lorsque la population est censée avoir une distribution asymétrique pour un ou plusieurs de ses facteurs discriminants (les revenus ou l’utilisation d’un produit, par exemple) le sondeur identifie des sous-groupes dans la population de la base de sondage, que l’on appelle des strates. Il extrait ensuite un échantillon aléatoire simple pour chaque strate.


IV. Méthodes d’échantillonnage non aléatoires

Voyons maintenant, parmi les méthodes d’échantillonnage non aléatoires, 4 méthodes empiriques auxquelles vous pouvez recourir en pratique. Elles sont ici décrites succinctement. Si vous souhaitez vous approprier ces techniques pour les mettre en œuvre dans vos enquêtes et sondages, je vous invite à lire cet article intitulé Techniques simples d’échantillonnage.

  1. Échantillonnage de convenance

    On parle d’un échantillon de convenance quand par exemple on choisit un endroit fréquenté, comme un carrefour piéton très emprunté ou un centre commercial, pour constituer la base de sondage à interroger. Autre exemple : pour son mémoire de fin d’études, un étudiant utilise une plate-forme pour poster son questionnaire en ligne et fait appel à la communauté pour obtenir des réponses.

    Ce type d’échantillon présente souvent des biais dont il faut tenir compte pour l’exploitation des résultats de l’enquête. L’erreur de couverture concerne les membres de la population qui ne fréquentent pas régulièrement ou pas du tout l’endroit choisi (carrefour, centre commercial ou plate-forme internet). On peut souligner une autre erreur liée à la méthode arbitraire utilisée par l’enquêteur pour sélectionner les personnes à interroger.

  2. Échantillonnage au jugé

    Le sondeur fait appel à son jugement ou à celui d’une autre personne compétente pour identifier les personnes à inclure dans l’échantillon. Les critères de sélection sont subjectifs et pratiques ; cela implique nécessairement que certains membres de la population auront moins de chances d’être sélectionnés que d’autres.

    Comme l’échantillon de convenance, l’échantillon constitué au jugé présente des risques de biais importants.

  3. Échantillonnage boule de neige

    Les personnes interrogées sont invitées à fournir le nom ou les coordonnées d’autres personnes qu’elles jugent aptes à répondre au questionnaire. De façon évidente, tous les membres de la population n’ont pas la même probabilité d’être sélectionnés.

    Par exemple, pour le lancement d’un nouveau produit pour les sportifs, on veut savoir quelles sont les attentes des consommateurs ; on commence à envoyer le questionnaire à quelques sportifs que l’on connait et on leur demande de le diffuser dans leur propre entourage.

    C’est l’effet boule de neige. Cette méthode fait l’objet d’un article à part entière de ce blog : Une alternative : la méthode de la boule de neige.

  4. Échantillonnage par quotas

    Le sondeur identifie des caractéristiques (critères démographiques ou utilisation de produits, par exemple) qui lui permettent de définir des quotas pour chaque catégorie. La taille des quotas est proportionnelle à la taille relative de chaque catégorie au sein de la population. La méthode des quotas sert souvent à s’assurer que les échantillons de convenance respectent la structure de la population et ses quotas.

    Comme la méthode de la boule de neige présentée juste avant, l’échantillonnage par quotas est détaillé dans cet article qui lui est dédié : Méthode (empirique) des quotas.


A ceux d’entre vous qui, arrivés à la fin de cet article, souhaitent approfondir, ayant besoin d’acquérir de solides connaissances en études marketing, je recommande particulièrement l’ouvrage Etudes et analyses marketing déjà cité plus haut.


Si cet article vous a plu, dites-le dans les commentaires et partagez-le sans modération !

A propos de Françoise Lafont

Cofondatrice de Questio, éditeur du logiciel questionnaire-pro, consultante et formatrice, je partage dans ce blog mes connaissances théoriques et pratiques dans le domaine des enquêtes et sondages en ligne, auto-diagnostics numériques et protection des données (RGPD).

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

5 + 4 =