Méthodes d’échantillonnage aléatoires et non aléatoires

Tirage aléatoire des boules du Loto© Dylan Nolte (Unsplash)

Les résultats d’une enquête par sondage ne sont extrapolables à la population tout entière que si l’échantillon est représentatif. Or cette représentativité est liée à la méthode d’échantillonnage appliquée, probabiliste ou empirique. Quelles sont ces méthodes ?

Cet article aborde un sujet théorique essentiel dans le monde des enquêtes et sondages. Je le traite ici de la façon la plus complète possible mais aussi la plus simple, pour être à la portée de tous :

  1. Les principaux concepts de l’échantillonnage : population, base de sondage, couverture, échantillon, etc.
  2. Représentativité de l’échantillon : peut-on extrapoler les résultats de l’enquête à la population entière ?
  3. Méthodes d’échantillonnage aléatoires : 4 méthodes issues des la théorie des probabilités
  4. Méthodes d’échantillonnage non aléatoires : 4 méthodes empiriques directement applicables

questionnaire-pro, logiciel d'enquêtes édité par Questio
Réalisation de sondages par la méthode des quotas, simples ou croisés, pour échantillon représentatif


I. Les principaux concepts de l’échantillonnage

Voici un schéma qui présente les principaux concepts à connaître (cette figure est reproduite à partir de l’ouvrage Etudes et analyses marketing dont la 8ème édition est parue chez Pearson en août 2018) :

  1. Population

    La population est l’ensemble des individus auxquels on s’intéresse, autrement dit c’est le groupe entier tel que défini dans les objectifs de l’enquête.

  2. Base de sondage

    La base de sondage disponible pour réaliser l’enquête ne correspond pas toujours exactement à la population. Par exemple, une liste extraite d’un annuaire d’entreprises peut ne pas être exhaustive, ne pas être à jour, contenir des entreprises qui ont fait faillite, etc. Dans certains cas, à défaut de liste, la base de sondage se résume à la série d’hypothèses formulées sur la population, par exemple les consommateurs de café buvant au moins deux tasses par jour.

  3. Erreur de couverture

    L’écart d’adéquation entre la base de sondage et la population entière correspond à l’erreur de couverture.

  4. Échantillon

    L’échantillon est le sous-ensemble de la population sélectionné pour représenter le groupe entier.

  5. Erreur d’échantillonnage

    On appelle erreur d’échantillonnage tout type d’erreur lié à la méthode d’échantillonnage. Dans le schéma ci-dessus, on voit qu’un partie de l’échantillon se trouve à l’extérieur de la population.

  6. Unité d’échantillonnage

    On appelle unité d’échantillonnage l’unité de base de l’enquête. Le plus souvent il s’agit de l’individu qui répond à l’enquête mais il peut aussi s’agir d’un foyer familial ou d’une entreprise.


II. Représentativité de l’échantillon

L’essentiel à retenir, c’est que les résultats obtenus sur l’échantillon ne sont extrapolables à la population entière que si l’échantillon est représentatif.

Or la représentativité de l’échantillon dépend essentiellement de la méthode d’échantillonnage adoptée :

En théorie, seul un échantillonnage aléatoire, aussi appelé probabiliste, car il repose sur la théorie des probabilités, permet d’obtenir des résultats représentatifs. Ceci sous réserve de l’absence d’autres biais comme par exemple l’erreur de couverture vue précédemment.

En pratique, comme le recours aux méthodes de sondage aléatoire est difficile à mettre en œuvre et requiert en général l’intervention d’un spécialiste, on se tourne le plus souvent vers une méthode de sondage empirique comme par exemple la méthode des quotas.

Méthode des quotas
A LIRE AUSSI

Techniques simples d’échantillonnage
Quels que soient vos objectifs et le type d’enquête à mener, vous allez devoir définir la population cible à interroger et vous chercherez à constituer un échantillon tiré de la base de sondage. En pratique, on choisira souvent une méthode […] Lire la suite


III. Méthodes d’échantillonnage aléatoires

Ces méthodes supposent qu’on dispose d’une base de sondage correspondant à la population étudiée (et aussi, ne l’oubliez pas, que toutes les unités de l’échantillon constitué répondent effectivement à l’enquête).

Si vous n’êtes pas dans ce cas de figure, vous pouvez passer directement aux méthodes non aléatoires.

Examinons ici 4 méthodes d’échantillonnage probabilistes parmi les plus utilisées :

  1. Échantillonnage aléatoire simple

    Le sondeur utilise des nombres sélectionnés de façon aléatoire par un ordinateur, compose des numéros au hasard ou utilise une autre procédure de sélection aléatoire qui garantit que tous les membres de la population de la base de sondage ont la même probabilité de faire partie de l’échantillon. Exemple : le tirage des boules du loto !

  2. Échantillonnage systématique

    Le sondeur s’appuie sur une base de sondage répertoriant les membres de la population pour sélectionner un point de départ aléatoire pour le premier membre de l’échantillon. Pour sélectionner tous les autres membres de l’échantillon, on utilise alors un pas, calculé en divisant le nombre d’unités de la base de sondage par la taille de l’échantillon.

    Vous trouverez la formule de calcul de la taille de l’échantillon en fonction du niveau de confiance souhaité et de la marge d’erreur tolérée dans cet autre article intitulé : Déterminer la taille de l’échantillon.
  3. Échantillonnage par grappes

    La base de sondage est divisée en sous-groupes appelés grappes, qui doivent partager de fortes similarités :

    • le sondeur peut alors sélectionner au hasard quelques grappes pour lesquelles il interroge la totalité des individus (échantillonnage en un degré) ;

    • il peut également choisir davantage de grappes au hasard et constituer des échantillons dans chaque grappe (échantillonnage en deux degrés).

    Cette méthode est à privilégier dans le cas de grappes très similaires pouvant être identifiées facilement, par exemple des espaces géographiques.

  4. Échantillonnage stratifié

    Lorsque la population est censée avoir une distribution asymétrique pour un ou plusieurs de ses facteurs discriminants (les revenus ou l’utilisation d’un produit, par exemple) le sondeur identifie des sous-groupes dans la population de la base de sondage, que l’on appelle des strates. Il extrait ensuite un échantillon aléatoire simple pour chaque strate.


IV. Méthodes d’échantillonnage non aléatoires

Voyons maintenant, parmi les méthodes d’échantillonnage non aléatoires, 4 méthodes empiriques auxquelles vous pouvez recourir en pratique. Elles sont ici décrites succinctement. Si vous souhaitez vous approprier ces techniques pour les mettre en œuvre dans vos enquêtes et sondages, je vous invite à lire cet article intitulé Techniques simples d’échantillonnage.

  1. Échantillonnage de convenance

    On parle d’un échantillon de convenance quand par exemple on choisit un endroit fréquenté, comme un carrefour piéton très emprunté ou un centre commercial, pour constituer la base de sondage à interroger. Autre exemple : pour son mémoire de fin d’études, un étudiant utilise une plate-forme pour poster son questionnaire en ligne et fait appel à la communauté pour obtenir des réponses.

    Ce type d’échantillon présente souvent des biais dont il faut tenir compte pour l’exploitation des résultats de l’enquête. L’erreur de couverture concerne les membres de la population qui ne fréquentent pas régulièrement ou pas du tout l’endroit choisi (carrefour, centre commercial ou plate-forme internet). On peut souligner une autre erreur liée à la méthode arbitraire utilisée par l’enquêteur pour sélectionner les personnes à interroger.

  2. Échantillonnage au jugé

    Le sondeur fait appel à son jugement ou à celui d’une autre personne compétente pour identifier les personnes à inclure dans l’échantillon. Les critères de sélection sont subjectifs et pratiques ; cela implique nécessairement que certains membres de la population auront moins de chances d’être sélectionnés que d’autres.

    Comme l’échantillon de convenance, l’échantillon constitué au jugé présente des risques de biais importants.

  3. Échantillonnage boule de neige

    Les personnes interrogées sont invitées à fournir le nom ou les coordonnées d’autres personnes qu’elles jugent aptes à répondre au questionnaire. De façon évidente, tous les membres de la population n’ont pas la même probabilité d’être sélectionnés.

    Par exemple, pour le lancement d’un nouveau produit pour les sportifs, on veut savoir quelles sont les attentes des consommateurs ; on commence à envoyer le questionnaire à quelques sportifs que l’on connait et on leur demande de le diffuser dans leur propre entourage.

    C’est l’effet boule de neige. Cette méthode fait l’objet d’un article à part entière de ce blog : Une alternative : la méthode de la boule de neige.

  4. Échantillonnage par quotas

    Le sondeur identifie des caractéristiques (critères démographiques ou utilisation de produits, par exemple) qui lui permettent de définir des quotas pour chaque catégorie. La taille des quotas est proportionnelle à la taille relative de chaque catégorie au sein de la population. La méthode des quotas sert souvent à s’assurer que les échantillons de convenance respectent la structure de la population et ses quotas.

    Comme la méthode de la boule de neige présentée juste avant, l’échantillonnage par quotas est détaillé dans cet article qui lui est dédié : Méthode (empirique) des quotas.


A ceux d’entre vous qui, arrivés à la fin de cet article, souhaitent approfondir, ayant besoin d’acquérir de solides connaissances en études marketing, je recommande particulièrement l’ouvrage Etudes et analyses marketing déjà cité plus haut.


Si cet article vous a plu, dites-le dans les commentaires et partagez-le sans modération !

A propos de Françoise Lafont

Cofondatrice de Questio (éditeur du logiciel questionnaire-pro), consultante et formatrice, je partage dans ce blog mes connaissances théoriques et pratiques dans le domaine des enquêtes et sondages en ligne, auto-diagnostics numériques et protection des données (RGPD).

17 commentaire(s) sur “Méthodes d’échantillonnage aléatoires et non aléatoires

  1. Bonjour à vous, mon sujet est: étalement urbain et mobilité spatiale à Soubré. Je souhaite enquêter la population pour savoir ce qui les motive à habiter en périphérie, arrive t’elle à se déplacer facilement, les prix des logements sont-ils accessibles, quelles sont les problèmes auxquels elle est confrontée. Comment je dois procéder svp ? Besoin d’explications merci

    1. Votre sujet a l’air très intéressant.
      On aborde traditionnellement un sujet tel que le vôtre en respectant les étapes suivantes :

      problématique : à quelle question l’étude doit répondre ?
      étude documentaire : elle consiste à tirer parti des informations déjà existantes, notamment par des recherches sur internet.
      étude qualitative : son objectif est de comprendre les comportements ou les motivations des individus et elle repose en général sur des entretiens individuels en profondeur ou sur des entretiens collectifs auprès d’un petit nombre de personnes ciblées (des experts par exemple).
      étude quantitative : elle a pour objectif de mesurer (ou quantifier, d’où son nom) les attitudes ou les opinions d’un échantillon de la population étudiée, ceci à partir des réponses obtenues à un questionnaire
      synthèse et décisions : le rapport de synthèse doit conduire à mettre en relief les réponses apportées par l’étude qui sont vraiment en rapport avec la problématique initiale.

      Bon courage pour vos travaux.

  2. Est-ce qu’il y a des situations particulières dans lesquelles les résultats issus d’une recherche basée sur la technique d’échantillonnage par convenance peuvent être généralisés ?

    1. Quand on utilise une méthode d’échantillonnage non aléatoire, comme la méthode des quotas ou dans votre cas un échantillon de convenance, en principe on ne peut pas extrapoler à la population toute entière les résultats obtenus sur l’échantillon. Cela dit, en pratique, si vous disposez de données de calage sur la population (par exemple la structure par sexe et par âge), vous pouvez contrôler votre échantillon a posteriori et éventuellement lui appliquer un redressement pour que sa structure corresponde à la structure de la population, comme les instituts de sondage le font couramment avec la méthode des quotas.

  3. Merci Mme Françoise Lafont, pour les différents articles que vous publiés, qui sont très pratiques. j’aimerais savoir qu’est ce qui détermine ou obligerait à utiliser échantillonnage non aléatoire (empirique), sachant qu’il ne sera jamais représentatif comme échantillonnage aléatoire. est ce que l’interprétation de ces 2 types d’échantillonnage se fait de la même façon ?

    1. Bonjour et merci pour votre retour positif sur les articles de ce blog !

      Ce qui contraint le plus souvent à utiliser un échantillonnage non aléatoire (empirique), c’est quand les conditions ne sont pas réunies pour constituer et interroger un échantillon aléatoire.
      Par exemple :
      – il n’existe pas de base de sondage correspondant à la population étudiée,
      – on ne peut pas garantir que toutes les unités de l’échantillon constitué vont effectivement répondre à l’enquête (personnes injoignables, ayant déménagé, refus de répondre, etc.),
      – ou tout simplement le recueil de l’information serait trop coûteux.

      Dans la pratique, dès lors que les unités interrogées sont des êtres humains (études de marché, sondages d’opinion, enquêtes de satisfaction…), il est extrêmement rare que les conditions soient réunies pour mettre en œuvre un échantillonnage aléatoire. On utilise donc des méthodes empiriques.

      Au niveau de l’analyse des réponses, il faut garder à l’esprit la façon dont l’échantillon a été constitué si on souhaite extrapoler à la population tout entière les résultats obtenus sur l’échantillon. Des tests statistiques comme par exemple le test du Khi-deux peuvent s’avérer précieux.

      En espérant avoir répondu à vos questions.

  4. Bonsoir Madame. Je suis en train de lire vos commentaires aux différentes préoccupations sur l’échantillonnage et je vois qu’il y a lieu de faire ce que vous appelez “redressement” après avoir fait recours à un échantillonnage non aléatoire. Ce faisant, j’aimerais en savoir plus parce que ça me parait intéressant.

    1. Bonjour et merci de l’intérêt que vous portez au blog de Questio et à cet article sur les méthodes d’échantillonnage.

      Effectivement si vous avez recueilli des données sur un échantillon et si vous disposez par ailleurs de données de calage sur la population dont est extraite l’échantillon, vous pouvez redresser les données obtenues sur l’échantillon.

      Le redressement est une pratique courante dans le domaine des sondages. Son objectif est d’améliorer la représentativité de l’échantillon interrogé, sur un certain nombre de critères de qualification. Dans le principe, seul un échantillon ayant la même structure que la population mère sur les critères que l’on connaît de cette population permet de généraliser les réponses obtenues sur les autres critères, à l’ensemble de cette population. Le redressement consiste donc à appliquer des pondérations aux réponses pour augmenter ou réduire le poids des répondants selon qu’ils sont sous représentés ou sur représentés dans l’échantillon interrogé par rapport à la population mère.

      Il existe différentes méthodes statistiques (en général itératives) pour calculer les poids de redressement, vous trouverez des informations sur ces méthodes en poursuivant vos recherches sur internet.

  5. Bonjour madame, je suis entrain de preparer mon pfe et jai besoin de quelque chose sur
    Les Apports de l’échantillonnage pour le développement des produits de l’entreprise. Merci

    1. Bonjour Ayoub, sincèrement désolée mais je ne sais pas ce que vous appelez “pfe” et à quel type de produits vous faites référence, aussi je ne peux pas répondre à votre demande. Pouvez-vous la préciser ?

  6. Bonjour Madame ,je veux savoir votre avis sur mon choix d’echantillion exhaustif pour mon projet de fin d’etude (pfe) dans lequel j’ai procede par une recherche action ,j’ai choisi une classe d’etudiants (dont l’effectif est de 27) d’une seule option a savoir l’anesthesie reanimation auxquels j’ai administre un portfolio a remplir au cours de leur stage et ce pendant une duree de deux mois ,sachant qu’ils n’ont jamais travaille avec ce type de document au cours de leur stage .dans mon etude je cherche a connaitre leur perceptions dudit outil et j’envisage leur administrer un questionnaire pour recueillir leur perceptions . Je veux savoir votre avis sur le choix de l’echantillion exhaustif ainsi que sur son effectif et sur la methode de recueil de donnees a savoir le questionnaire et mercii .

    1. Si je vous comprends bien, Naima, la population totale de votre étude est de 27 individus. Avec une population mère si petite, vous n’êtes pas vraiment dans une problématique d’échantillonnage. Si vous appliquez la formule de calcul de la taille de l’échantillon, avec le coefficient correcteur lié aux petites populations, vous allez trouver qu’il faut interroger quasiment la totalité de la population, sinon la précision de l’estimation sera très dégradée. Donc il faut en effet vous orienter vers un échantillon exhaustif.

  7. Bonjour Françoise, je vous remercie pour ce travail d’accompagnement que vous faites. Vous avez une approche simplifiée de l’explication et ca nous permet de voir plus clair certains aspects de nos travaux de recherche.
    je fais en ce moment un travail de recherche sur la promotion pharmaceutique dans mon pays et son impact sur la pratique medico-pharmaceutique. j’opterai pour une méthode qualitative et quantitative. A ce titre je souhaiterais faire une enquête auprès de médecins et pharmaciens dans les 4 principales villes de mon pays le Cameroun. Comment pourrais je faire pour déterminer la taille de l’échantillon? Merci d’avance

    1. Tout d’abord merci, Tiam Wilfried, pour votre appréciation sur le blog de Questio.

      Concernant votre problématique, j’aurais tendance à l’aborder avec un échantillonnage par grappes. Ceci à supposer que vous disposiez d’une base de sondage correspondant à la population étudiée, dans votre cas une liste exhaustive des médecins et pharmaciens exerçant dans les 4 villes du Cameroun que vous étudiez.

      La méthode des grappes est intéressante si chaque ville présente des caractéristiques distinctes et bien identifiables et si ces caractéristiques peuvent influer sur ce que vous cherchez à mesurer par votre étude. Pour faire un parallèle avec des grappes de raisin, si une grappe est très exposée au soleil et une autre est à l’ombre sous le feuillage, il faut goûter un grain de chaque grappe pour savoir si le raisin est à maturité ! Dans ce blog qui est généraliste, je ne détaille pas cette méthode d’échantillonnage particulière mais vous trouverez sûrement des explications complémentaires en poursuivant vos recherches sur internet.

      Ce qui est important avant tout, c’est la connaissance que vous pouvez avoir en amont de la population que vous voulez étudier (données et statistiques disponibles, études menées antérieurement, etc.). C’est cette connaissance qui vous permettra de choisir la meilleure méthode d’échantillonnage. La formule de calcul de la taille de l’échantillon est ici.

      Quant à l’approche qualitative, elle vous permettra, entre autres, de bâtir le questionnaire pour la phase quantitative.

      Vous souhaitant le meilleur succès dans vos travaux.

Répondre à Kevin DAH Annuler la réponse

Votre adresse e-mail ne sera pas publiée.

Résoudre : *
15 − 13 =