Méthodes d’échantillonnage aléatoires et non aléatoires

Tirage aléatoire des boules du Loto© Dylan Nolte (Unsplash)

Les résultats d’une enquête par sondage ne sont extrapolables à la population tout entière que si l’échantillon est représentatif. Or cette représentativité est liée à la méthode d’échantillonnage appliquée, probabiliste ou empirique. Quelles sont ces méthodes ?

Cet article aborde un sujet théorique essentiel dans le monde des enquêtes et sondages. Je le traite ici de la façon la plus complète possible mais aussi la plus simple, pour être à la portée de tous :

  1. Les principaux concepts de l’échantillonnage : population, base de sondage, couverture, échantillon, etc.
  2. Représentativité de l’échantillon : peut-on extrapoler les résultats de l’enquête à la population entière ?
  3. Méthodes d’échantillonnage aléatoires : 4 méthodes issues des la théorie des probabilités
  4. Méthodes d’échantillonnage non aléatoires : 4 méthodes empiriques directement applicables

questionnaire-pro, logiciel d'enquêtes édité par Questio
Réalisation de sondages par la méthode des quotas, simples ou croisés, pour échantillon représentatif


I. Les principaux concepts de l’échantillonnage

Voici un schéma qui présente les principaux concepts à connaître (cette figure est reproduite à partir de l’ouvrage Etudes et analyses marketing dont la 8ème édition est parue chez Pearson en août 2018) :

  1. Population

    La population est l’ensemble des individus auxquels on s’intéresse, autrement dit c’est le groupe entier tel que défini dans les objectifs de l’enquête.

  2. Base de sondage

    La base de sondage disponible pour réaliser l’enquête ne correspond pas toujours exactement à la population. Par exemple, une liste extraite d’un annuaire d’entreprises peut ne pas être exhaustive, ne pas être à jour, contenir des entreprises qui ont fait faillite, etc. Dans certains cas, à défaut de liste, la base de sondage se résume à la série d’hypothèses formulées sur la population, par exemple les consommateurs de café buvant au moins deux tasses par jour.

  3. Erreur de couverture

    L’écart d’adéquation entre la base de sondage et la population entière correspond à l’erreur de couverture.

  4. Échantillon

    L’échantillon est le sous-ensemble de la population sélectionné pour représenter le groupe entier.

  5. Erreur d’échantillonnage

    On appelle erreur d’échantillonnage tout type d’erreur lié à la méthode d’échantillonnage. Dans le schéma ci-dessus, on voit qu’un partie de l’échantillon se trouve à l’extérieur de la population.

  6. Unité d’échantillonnage

    On appelle unité d’échantillonnage l’unité de base de l’enquête. Le plus souvent il s’agit de l’individu qui répond à l’enquête mais il peut aussi s’agir d’un foyer familial ou d’une entreprise.


II. Représentativité de l’échantillon

L’essentiel à retenir, c’est que les résultats obtenus sur l’échantillon ne sont extrapolables à la population entière que si l’échantillon est représentatif.

Or la représentativité de l’échantillon dépend essentiellement de la méthode d’échantillonnage adoptée :

En théorie, seul un échantillonnage aléatoire, aussi appelé probabiliste, car il repose sur la théorie des probabilités, permet d’obtenir des résultats représentatifs. Ceci sous réserve de l’absence d’autres biais comme par exemple l’erreur de couverture vue précédemment.

En pratique, comme le recours aux méthodes de sondage aléatoire est difficile à mettre en œuvre et requiert en général l’intervention d’un spécialiste, on se tourne le plus souvent vers une méthode de sondage empirique comme par exemple la méthode des quotas.

Méthode des quotas
A LIRE AUSSI

Techniques simples d’échantillonnage
Quels que soient vos objectifs et le type d’enquête à mener, vous allez devoir définir la population cible à interroger et vous chercherez à constituer un échantillon tiré de la base de sondage. En pratique, on choisira souvent une méthode […] Lire la suite


III. Méthodes d’échantillonnage aléatoires

Ces méthodes supposent qu’on dispose d’une base de sondage correspondant à la population étudiée (et aussi, ne l’oubliez pas, que toutes les unités de l’échantillon constitué répondent effectivement à l’enquête).

Si vous n’êtes pas dans ce cas de figure, vous pouvez passer directement aux méthodes non aléatoires.

Examinons ici 4 méthodes d’échantillonnage probabilistes parmi les plus utilisées :

  1. Échantillonnage aléatoire simple

    Le sondeur utilise des nombres sélectionnés de façon aléatoire par un ordinateur, compose des numéros au hasard ou utilise une autre procédure de sélection aléatoire qui garantit que tous les membres de la population de la base de sondage ont la même probabilité de faire partie de l’échantillon. Exemple : le tirage des boules du loto !

  2. Échantillonnage systématique

    Le sondeur s’appuie sur une base de sondage répertoriant les membres de la population pour sélectionner un point de départ aléatoire pour le premier membre de l’échantillon. Pour sélectionner tous les autres membres de l’échantillon, on utilise alors un pas, calculé en divisant le nombre d’unités de la base de sondage par la taille de l’échantillon.

    Vous trouverez la formule de calcul de la taille de l’échantillon en fonction du niveau de confiance souhaité et de la marge d’erreur tolérée dans cet autre article intitulé : Déterminer la taille de l’échantillon.
  3. Échantillonnage par grappes

    La base de sondage est divisée en sous-groupes appelés grappes, qui doivent partager de fortes similarités :

    • le sondeur peut alors sélectionner au hasard quelques grappes pour lesquelles il interroge la totalité des individus (échantillonnage en un degré) ;

    • il peut également choisir davantage de grappes au hasard et constituer des échantillons dans chaque grappe (échantillonnage en deux degrés).

    Cette méthode est à privilégier dans le cas de grappes très similaires pouvant être identifiées facilement, par exemple des espaces géographiques.

  4. Échantillonnage stratifié

    Lorsque la population est censée avoir une distribution asymétrique pour un ou plusieurs de ses facteurs discriminants (les revenus ou l’utilisation d’un produit, par exemple) le sondeur identifie des sous-groupes dans la population de la base de sondage, que l’on appelle des strates. Il extrait ensuite un échantillon aléatoire simple pour chaque strate.


IV. Méthodes d’échantillonnage non aléatoires

Voyons maintenant, parmi les méthodes d’échantillonnage non aléatoires, 4 méthodes empiriques auxquelles vous pouvez recourir en pratique. Elles sont ici décrites succinctement. Si vous souhaitez vous approprier ces techniques pour les mettre en œuvre dans vos enquêtes et sondages, je vous invite à lire cet article intitulé Techniques simples d’échantillonnage.

  1. Échantillonnage de convenance

    On parle d’un échantillon de convenance quand par exemple on choisit un endroit fréquenté, comme un carrefour piéton très emprunté ou un centre commercial, pour constituer la base de sondage à interroger. Autre exemple : pour son mémoire de fin d’études, un étudiant utilise une plate-forme pour poster son questionnaire en ligne et fait appel à la communauté pour obtenir des réponses.

    Ce type d’échantillon présente souvent des biais dont il faut tenir compte pour l’exploitation des résultats de l’enquête. L’erreur de couverture concerne les membres de la population qui ne fréquentent pas régulièrement ou pas du tout l’endroit choisi (carrefour, centre commercial ou plate-forme internet). On peut souligner une autre erreur liée à la méthode arbitraire utilisée par l’enquêteur pour sélectionner les personnes à interroger.

  2. Échantillonnage au jugé

    Le sondeur fait appel à son jugement ou à celui d’une autre personne compétente pour identifier les personnes à inclure dans l’échantillon. Les critères de sélection sont subjectifs et pratiques ; cela implique nécessairement que certains membres de la population auront moins de chances d’être sélectionnés que d’autres.

    Comme l’échantillon de convenance, l’échantillon constitué au jugé présente des risques de biais importants.

  3. Échantillonnage boule de neige

    Les personnes interrogées sont invitées à fournir le nom ou les coordonnées d’autres personnes qu’elles jugent aptes à répondre au questionnaire. De façon évidente, tous les membres de la population n’ont pas la même probabilité d’être sélectionnés.

    Par exemple, pour le lancement d’un nouveau produit pour les sportifs, on veut savoir quelles sont les attentes des consommateurs ; on commence à envoyer le questionnaire à quelques sportifs que l’on connait et on leur demande de le diffuser dans leur propre entourage.

    C’est l’effet boule de neige. Cette méthode fait l’objet d’un article à part entière de ce blog : Une alternative : la méthode de la boule de neige.

  4. Échantillonnage par quotas

    Le sondeur identifie des caractéristiques (critères démographiques ou utilisation de produits, par exemple) qui lui permettent de définir des quotas pour chaque catégorie. La taille des quotas est proportionnelle à la taille relative de chaque catégorie au sein de la population. La méthode des quotas sert souvent à s’assurer que les échantillons de convenance respectent la structure de la population et ses quotas.

    Comme la méthode de la boule de neige présentée juste avant, l’échantillonnage par quotas est détaillé dans cet article qui lui est dédié : Méthode (empirique) des quotas.


A ceux d’entre vous qui, arrivés à la fin de cet article, souhaitent approfondir, ayant besoin d’acquérir de solides connaissances en études marketing, je recommande particulièrement l’ouvrage Etudes et analyses marketing déjà cité plus haut.


Si cet article vous a plu, dites-le dans les commentaires et partagez-le sans modération !

A propos de Françoise Lafont

Cofondatrice de Questio (éditeur du logiciel questionnaire-pro), consultante et formatrice, je partage dans ce blog mes connaissances théoriques et pratiques dans le domaine des enquêtes et sondages en ligne, auto-diagnostics numériques et protection des données (RGPD).

50 commentaire(s) sur “Méthodes d’échantillonnage aléatoires et non aléatoires

  1. Très bon article , il sert de rappel mémoire aux fondamentaux dans les études de marché.

  2. Bonjour à vous, mon sujet est: étalement urbain et mobilité spatiale à Soubré. Je souhaite enquêter la population pour savoir ce qui les motive à habiter en périphérie, arrive t’elle à se déplacer facilement, les prix des logements sont-ils accessibles, quelles sont les problèmes auxquels elle est confrontée. Comment je dois procéder svp ? Besoin d’explications merci

    1. Votre sujet a l’air très intéressant.
      On aborde traditionnellement un sujet tel que le vôtre en respectant les étapes suivantes :

      problématique : à quelle question l’étude doit répondre ?
      étude documentaire : elle consiste à tirer parti des informations déjà existantes, notamment par des recherches sur internet.
      étude qualitative : son objectif est de comprendre les comportements ou les motivations des individus et elle repose en général sur des entretiens individuels en profondeur ou sur des entretiens collectifs auprès d’un petit nombre de personnes ciblées (des experts par exemple).
      étude quantitative : elle a pour objectif de mesurer (ou quantifier, d’où son nom) les attitudes ou les opinions d’un échantillon de la population étudiée, ceci à partir des réponses obtenues à un questionnaire
      synthèse et décisions : le rapport de synthèse doit conduire à mettre en relief les réponses apportées par l’étude qui sont vraiment en rapport avec la problématique initiale.

      Bon courage pour vos travaux.

  3. Magnifique article ! Est-ce qu’il y a des situations particulières dans lesquelles les résultats issus d’une recherche basée sur la technique d’échantillonnage par convenance peuvent être généralisés ?

    1. Quand on utilise une méthode d’échantillonnage non aléatoire, comme la méthode des quotas ou dans votre cas un échantillon de convenance, en principe on ne peut pas extrapoler à la population toute entière les résultats obtenus sur l’échantillon.

      Cela dit, en pratique, si vous disposez de données de calage sur la population (par exemple la structure par sexe et par âge), vous pouvez contrôler votre échantillon a posteriori et éventuellement lui appliquer un redressement pour que sa structure corresponde à la structure de la population, comme les instituts de sondage le font couramment avec la méthode des quotas.

  4. Merci Mme Françoise Lafont, pour les différents articles que vous publiés, qui sont très pratiques. j’aimerais savoir qu’est ce qui détermine ou obligerait à utiliser échantillonnage non aléatoire (empirique), sachant qu’il ne sera jamais représentatif comme échantillonnage aléatoire. est ce que l’interprétation de ces 2 types d’échantillonnage se fait de la même façon ?

    1. Bonjour et merci pour votre retour positif sur les articles de ce blog !

      Ce qui contraint le plus souvent à utiliser un échantillonnage non aléatoire (empirique), c’est quand les conditions ne sont pas réunies pour constituer et interroger un échantillon aléatoire.
      Par exemple :
      – il n’existe pas de base de sondage correspondant à la population étudiée,
      – on ne peut pas garantir que toutes les unités de l’échantillon constitué vont effectivement répondre à l’enquête (personnes injoignables, ayant déménagé, refus de répondre, etc.),
      – ou tout simplement le recueil de l’information serait trop coûteux.

      Dans la pratique, dès lors que les unités interrogées sont des êtres humains (études de marché, sondages d’opinion, enquêtes de satisfaction…), il est extrêmement rare que les conditions soient réunies pour mettre en œuvre un échantillonnage aléatoire. On utilise donc des méthodes empiriques.

      Au niveau de l’analyse des réponses, il faut garder à l’esprit la façon dont l’échantillon a été constitué si on souhaite extrapoler à la population tout entière les résultats obtenus sur l’échantillon. Des tests statistiques comme par exemple le test du Khi-deux peuvent s’avérer précieux.

      En espérant avoir répondu à vos questions.

  5. Bonsoir Madame. Je suis en train de lire vos commentaires aux différentes préoccupations sur l’échantillonnage et je vois qu’il y a lieu de faire ce que vous appelez « redressement » après avoir fait recours à un échantillonnage non aléatoire. Ce faisant, j’aimerais en savoir plus parce que ça me parait intéressant.

    1. Bonjour et merci de l’intérêt que vous portez au blog de Questio et à cet article sur les méthodes d’échantillonnage.

      Effectivement si vous avez recueilli des données sur un échantillon et si vous disposez par ailleurs de données de calage sur la population dont est extraite l’échantillon, vous pouvez redresser les données obtenues sur l’échantillon.

      Le redressement est une pratique courante dans le domaine des sondages. Son objectif est d’améliorer la représentativité de l’échantillon interrogé, sur un certain nombre de critères de qualification. Dans le principe, seul un échantillon ayant la même structure que la population mère sur les critères que l’on connaît de cette population permet de généraliser les réponses obtenues sur les autres critères, à l’ensemble de cette population. Le redressement consiste donc à appliquer des pondérations aux réponses pour augmenter ou réduire le poids des répondants selon qu’ils sont sous représentés ou sur représentés dans l’échantillon interrogé par rapport à la population mère.

      Il existe différentes méthodes statistiques (en général itératives) pour calculer les poids de redressement, vous trouverez des informations sur ces méthodes en poursuivant vos recherches sur internet.

  6. Bonjour madame, je suis entrain de preparer mon pfe et jai besoin de quelque chose sur
    Les Apports de l’échantillonnage pour le développement des produits de l’entreprise. Merci

    1. Bonjour Ayoub, sincèrement désolée mais je ne sais pas ce que vous appelez « pfe » et à quel type de produits vous faites référence, aussi je ne peux pas répondre à votre demande. Pouvez-vous la préciser ?

  7. Bonjour Madame ,je veux savoir votre avis sur mon choix d’echantillion exhaustif pour mon projet de fin d’etude (pfe) dans lequel j’ai procede par une recherche action ,j’ai choisi une classe d’etudiants (dont l’effectif est de 27) d’une seule option a savoir l’anesthesie reanimation auxquels j’ai administre un portfolio a remplir au cours de leur stage et ce pendant une duree de deux mois ,sachant qu’ils n’ont jamais travaille avec ce type de document au cours de leur stage .dans mon etude je cherche a connaitre leur perceptions dudit outil et j’envisage leur administrer un questionnaire pour recueillir leur perceptions . Je veux savoir votre avis sur le choix de l’echantillion exhaustif ainsi que sur son effectif et sur la methode de recueil de donnees a savoir le questionnaire et mercii .

    1. Si je vous comprends bien, Naima, la population totale de votre étude est de 27 individus. Avec une population mère si petite, vous n’êtes pas vraiment dans une problématique d’échantillonnage. Si vous appliquez la formule de calcul de la taille de l’échantillon, avec le coefficient correcteur lié aux petites populations, vous allez trouver qu’il faut interroger quasiment la totalité de la population, sinon la précision de l’estimation sera très dégradée. Donc il faut en effet vous orienter vers un échantillon exhaustif.

  8. Bonjour Françoise, je vous remercie pour ce travail d’accompagnement que vous faites. Vous avez une approche simplifiée de l’explication et ca nous permet de voir plus clair certains aspects de nos travaux de recherche.
    je fais en ce moment un travail de recherche sur la promotion pharmaceutique dans mon pays et son impact sur la pratique medico-pharmaceutique. j’opterai pour une méthode qualitative et quantitative. A ce titre je souhaiterais faire une enquête auprès de médecins et pharmaciens dans les 4 principales villes de mon pays le Cameroun. Comment pourrais je faire pour déterminer la taille de l’échantillon? Merci d’avance

    1. Tout d’abord merci, Tiam Wilfried, pour votre appréciation sur le blog de Questio.

      Concernant votre problématique, j’aurais tendance à l’aborder avec un échantillonnage par grappes. Ceci à supposer que vous disposiez d’une base de sondage correspondant à la population étudiée, dans votre cas une liste exhaustive des médecins et pharmaciens exerçant dans les 4 villes du Cameroun que vous étudiez.

      La méthode des grappes est intéressante si chaque ville présente des caractéristiques distinctes et bien identifiables et si ces caractéristiques peuvent influer sur ce que vous cherchez à mesurer par votre étude. Pour faire un parallèle avec des grappes de raisin, si une grappe est très exposée au soleil et une autre est à l’ombre sous le feuillage, il faut goûter un grain de chaque grappe pour savoir si le raisin est à maturité ! Dans ce blog qui est généraliste, je ne détaille pas cette méthode d’échantillonnage particulière mais vous trouverez sûrement des explications complémentaires en poursuivant vos recherches sur internet.

      Ce qui est important avant tout, c’est la connaissance que vous pouvez avoir en amont de la population que vous voulez étudier (données et statistiques disponibles, études menées antérieurement, etc.). C’est cette connaissance qui vous permettra de choisir la meilleure méthode d’échantillonnage. La formule de calcul de la taille de l’échantillon est ici.

      Quant à l’approche qualitative, elle vous permettra, entre autres, de bâtir le questionnaire pour la phase quantitative.

      Vous souhaitant le meilleur succès dans vos travaux.

  9. Bonsoir, ma question consiste seulement à savoir l’auteur de la formule : n=N/1+(N×e²)

    1. Désolée Maombi Othniel, pour tenter de vous répondre il faudrait d’abord spécifier les variables contenues dans cette formule et le contexte dans lequel elle s’applique. Je peux imaginer que n et N seraient respectivement la taille de l’échantillon et celle de la population mais pour le reste, vous me faites jouer aux devinettes !!!

  10. Bonjour, je dois faire une enquete et la polation enqueter est de 150 personnes répartis dans trois zones est ce que je peux utiliser l’échantillonage probalistique stratifié et comment svp?

    1. Bonjour Antoinette, merci pour votre question.

      Oui, sur le principe, pour une population répartie dans trois zones, il est possible de partir sur un échantillonnage par strates. Cette méthode est particulièrement intéressante si les zones présentent des caractéristiques différentes les unes des autres.

      Toutefois, j’attire votre attention sur la petite taille de votre population : 150 personnes réparties sur trois zones, cela fait en moyenne une cinquantaine d’individus par zone. Vous allez devoir appliquer un coefficient correcteur à vos calculs de taille d’échantillon, qui risque de vous conduire à interroger une proportion très importante de la population.

      Dans ce contexte, la notion même d’échantillon pose question. Je vous invite à revoir en amont les objectifs de l’enquête pour trouver la méthodologie adéquate.

  11. Bonjour Françoise,
    Ma préoccupation est celle-ci, j’ai réalisé mes enquêtes dans six (6) quartiers dans une même commune ( commune de Ndjili/Congo Kinshasa), par quartier j’ai enquêté 10 ménages aléatoirement,

    Alors j’aimerais savoir, quels sont les arguments motivant un chercheur de faire un échantillonnage aléatoire ?

    1. Bonjour et merci Bilo pour votre question. La réponse est plutôt simple. Le principal intérêt d’un échantillonnage purement aléatoire (probabiliste), c’est qu’il permet d’obtenir un échantillon représentatif, et donc qu’il est possible d’extrapoler les résultats obtenus sur l’échantillon à la population tout entière. Ce qui est particulièrement puissant, reconnaissons-le !

      Toutefois, dans les sciences humaines, il est assez difficile de mettre en œuvre une méthode vraiment aléatoire pour constituer l’échantillon. Vous dites que vous avez « enquêté 10 ménages aléatoirement » mais comment avez-vous procédé ? Pouvez-vous garantir que tous les ménages avaient la même chance d’être sélectionnés dans votre échantillon ?

      Supposons par exemple que vous avez frappé aux portes. Si des ménages étaient absents au moment où vous vous êtes présenté, ils n’ont pas pu être enquêtés, ils n’avaient donc pas la même chance d’être dans l’échantillon que leurs voisins qui étaient présents.
      Et même si tous les ménages étaient présents, certains ont peut-être refusé de répondre pour une raison X ou Y que vous ne connaissez pas ; le motif du refus est possiblement la source d’un biais statistique.

      Cela ne veut pas dire que votre étude n’est pas fiable mais, en tant que chercheur, vous devez être parfaitement conscient des réserves que le mode d’échantillonnage choisi induit sur vos résultats, et en faire une analyse rigoureuse.

  12. Bonsoir Mme,

    Merci pour toutes les informations que vous nous données et vos réponses sont très instructifs.
    Je doit soutenir sur le thème  » le suivi et le traitement du courrier via une application de gestion électronique de documents ». Ma population total est de 2257 (pour trois (3) directions), mon échantillon est de 423 et mes retours de questionnaire est de 153.
    Dans ce cas comment pourrai-je me défendre si l’on me demande si mon échantillonnage est représentatif. Merci.

    1. Si je comprends bien, Esther, vous avez sélectionné un échantillon de 423 personnes mais seules 153 personnes ont répondu au questionnaire. Votre échantillon réel est donc de 153. Toutefois une taille d’échantillon ne suffit pas à savoir si un échantillon est représentatif ou non. C’est la méthode d’échantillonnage qui compte 😉

      Plusieurs remarques :

      1) Dans l’absolu et en supposant que l’échantillon soit représentatif, 153 répondants ce n’est pas vraiment suffisant pour vous apporter une bonne précision dans les résultats obtenus. Je vous invite à calculer votre marge d’erreur pour une proportion donnée, en partant de votre taille d’échantillon et en renversant la formule de calcul donnée ici. Si vos résultats ne sont pas des proportions mais des moyennes (données numériques) la formule existe aussi, vous la trouverez en poursuivant vos recherches sur internet.

      2) Près des 2/3 des personnes sollicitées n’ont pas répondu au questionnaire, ce taux de non-réponse est une source de biais importante. Il vous faudrait connaître les motifs de cette non-réponse et les analyser pour être en mesure d’argumenter si besoin. Ou a minima étudier le profil des non-répondants (si vous le connaissez) pour le comparer à celui des répondants. Il y a sûrement beaucoup à apprendre sur ce point.

      3) Normalement, on définit la méthode d’échantillonnage avant de réaliser l’enquête. Mais il est possible de contrôler a posteriori la représentativité d’un échantillon, à condition de disposer de données de calage à la fois sur l’échantillon et sur la population tout entière. Si l’échantillon respecte la même structure que la population toute entière sur deux ou trois variables clés, alors on peut extrapoler les résultats, en tenant compte de l’intervalle de confiance et de la marge d’erreur. C’est le principe de base de la méthode des quotas.

      En espérant que ces éléments vous aideront à justifier votre démarche. Bon courage !

  13. Bonjour madame,
    Je me demandais si selon la méthode d’échantillonnage, est-on toujours représentatif de la population d’étude.?
    Je m’explique pour une étude, j’ai le choix d’effectuer une échantillonnage soit en réalisant une sélection aléatoire dans ma population ou soit en réalisant une sélection selon des proportions déterminées dans cette population.
    En vous remerciant.

    1. Et non justement Céline, en ne prenant qu’un échantillon, on n’est pas toujours représentatif de la population étudiée, toute la difficulté est là. Si vous avez la possibilité de réaliser un tirage réellement aléatoire dans votre population, c’est une très grande chance et je pense que vous devriez la saisir !

  14. Bonjour Françoise, tout d’abord merci pour vos explications. Pour une personne comme moi, pas très à l’aise avec tout ça c’est vraiment très bien.
    Ma question est la suivante j’ai élaboré une enquête sur la performance des salariés en entreprise, il me faut un minimum de 50 répondants . Quelle sera la taille de l’échantillon ? Je vous remercie pour votre retour

    1. Bonjour Fatouma et merci de votre question. Mais je ne suis pas sûre de bien comprendre votre interrogation : si vous prévoyez d’interroger 50 individus parmi l’ensemble des salariés de l’entreprise étudiée, alors la taille de votre échantillon, c’est 50 ! S’ils ne sont que 47 à répondre réellement, alors la taille de l’échantillon égale 47.

      Juste une remarque, dans l’absolu, un échantillon de l’ordre de 50 répondants ce n’est pas beaucoup pour une étude quantitative… Cela permet normalement de stabiliser une proportion mais ce n’est pas suffisant pour stabiliser une moyenne.

  15. Bonjour Madame.
    J’aimerais savoir comment désigne-t-on une situation où toute la population cible fait l’objet de l’enquête. Par exemple, le projet a formé 100 producteurs sur des techniques de production en Afrique. 2 ans plus tard le projet veut connaitre les effets de son intervention sur les bénéficiaires. Vu que la population est limitée, l’on décide d’administrer le questionnaire sur les 100 producteurs et non de faire un échantillon. Comment peut-on appeler cela ?
    Merci beaucoup

    1. Bonjour Amine, quand on recueille des données sur 100% de la population, c’est ce qu’on appelle techniquement un recensement. Toutefois on a coutume d’utiliser ce mot pour le recensement de la population d’un pays, et plus rarement pour des contextes d’études spécifiques.

      Dans votre cas, je serais tentée de dire qu’il s’agit d’une enquête exhaustive.

  16. bonjour madame Françoise Lafont
    dans quel cas on peut dire qu’un tirage aléatoire stratifié est meilleur par rapport à un tirage aléatoire simple.
    dans quel cas on peut dire qu’un tirage systématique est meilleur par rapport à un tirage aléatoire simple.
    comment je peux transformer les certitudes en incertitudes.

    1. Merci Amine pour votre question qui est tout à fait pertinente. En réalité, on ne peut pas dire dans l’absolu qu’un type d’échantillonnage est meilleur ou moins bon qu’un autre.

      C’est VOTRE connaissance (la plus fine possible) de la population a étudier qui va vous conduire à choisir plutôt telle ou telle méthode.

      Par exemple, l’échantillonnage par strates est une méthode particulièrement intéressante si votre population se répartit en plusieurs groupes présentant des caractéristiques différentes les unes des autres. Imaginons une étude sur les transports publics urbains, les habitants du centre ville n’ont généralement pas le même profil que les habitants de la périphérie, du coup ils n’ont sans doute pas les mêmes habitudes de déplacement et les mêmes attentes, tirer des sous-échantillons semble pertinent a priori. Autre cas de figure, on utilise souvent un échantillon stratifié quand on connait à l’avance les tranches de revenus des foyers de la cible à interroger.

      Vous voyez, c’est vraiment en fonction des données dont vous disposez sur la population étudiée, et de votre analyse en amont de la problématique, que vous pourrez choisir la meilleure méthode d’échantillonnage. Je vous souhaite le meilleur succès dans votre projet d’étude.

  17. Merci madame Françoise Lafont pour vos différentes interactions
    Je suis entrain de mener une étude comparative des niveaux des efficacités économiques des 6 villages différents.
    J’ai choisi d’utiliser l’échantillonnage stratifié pour mon travail.
    Je ne sais pas si celà cadre avec mon travail

    1. Merci Viviane pour votre commentaire. Vous ne précisez pas si les strates que vous envisagez sont les 6 villages que vous étudiez mais je suppose que c’est le cas.

      Un échantillonnage stratifié est particulièrement intéressant lorsque la population étudiée est censée avoir une distribution asymétrique pour une ou plusieurs caractéristiques (niveau de revenu par exemple).
      A l’inverse, on pratique l’échantillonnage par grappes quand la base de sondage peut être divisée en sous-groupes (grappes) qui partagent de fortes similarités. La méthode des grappes est utile quand on s’intéresse à des espaces géographiques distincts, comme c’est votre cas.

      Reste à savoir si les villages sont plutôt similaires ou au contraire très différents, là je ne peux pas vous aider ! Seule votre connaissance a priori du sujet d’étude peut vous guider dans votre choix méthodologique.

      J’ajoute que les deux méthodes peuvent sembler proches au niveau du tirage de l’échantillon mais les concepts statistiques sur lesquels elles reposent ne sont pas les mêmes, le calcul des estimateurs de résultats est donc différent.

    2. Merci pour vos explications. Mon étude consiste à estimer les niveaux des efficacités économiques des producteurs semenciers d’un département. Pour cela, j’ai identifié des groupements de producteurs dans 6 villages différents. Je suis dans l’obligation de choisir des producteurs individuellement dans chaque groupement de chaque village.

      Les caractéristiques de chaque village sont distinctes de autres ( leur niveau de revenu, leur statut, leur effectif par groupement, leur répartition par sexe etc.). Mais ces différents producteurs sont tous spécialisés dans la même production semencière.
      Mon principal souci est que j’ai des groupements des producteurs de taille très réduite (9, 15, 18) dans certains villages et d’autres (100, 90, 50).

      J’aimerais savoir s’il faille respecter le pourcentage à échantillonner (70%) ou sélectionner la totalité des effectifs dont la taille est réduite et respecter ce critère si elle est élevée ? Quel est la technique d’échantillonnage ?

      Vos réponses me seront très utiles.

    3. Rebonjour Viviane,

      Compte tenu de la disparité de taille des groupements de producteurs, je vous suggère d’adopter la méthode suivante :

      – là où il y a peu de producteurs (9), il faut interroger tout le monde
      – là où ils sont 15 ou 18, essayez d’interroger le maximum de producteurs, disons au moins un producteur sur deux
      – là où le nombre de producteurs est plus important, vous pouvez appliquer un taux de sondage dégressif

      A titre indicatif, sur une population totale de 282 producteurs si j’ai bien compris, pour estimer une proportion avec un niveau de confiance de 95% et une marge d’erreur à 5%, vous devez interroger un échantillon de 162 producteurs.
      Si votre échantillon est moins grand, la précision de votre estimation sera moins bonne.
      La précision dépend également de la dispersion (écart-type) de la variable que vous cherchez à estimer.

      Ces calculs sont présentés ici : https://blog.questio.fr/determiner-taille-echantillon.
      Le calcul du coefficient correcteur applicable aux petites populations se trouve dans les commentaires de l’article.

    4. Merci beaucoup pour vos réponses. Est-ce que c’est la technique d’échantillonnage stratifié ?

    5. C’est en effet une technique inspirée de l’échantillonnage stratifié mais ça reste une méthode empirique.

      Quand les individus de la population étudiée sont des êtres humains, dans votre cas les producteurs de semences, il est quasiment impossible de procéder à de purs tirages aléatoires. Même si vous trouvez un système pour tirer aléatoirement les producteurs que vous allez interroger, rien ne garantit qu’ils vont tous répondre, l’un peut être absent, malade, avoir cessé l’activité ou tout simplement refuser de répondre à vos questions… Du coup, vous allez peut-être pouvoir interroger un autre producteur du même groupement à la place mais alors votre échantillon n’est plus aléatoire.

      Même les grands instituts de sondage ont recours à des méthodes empiriques, généralement la méthode des quotas.
      A fortiori avec une petite population comme la vôtre, les lois des grands nombres sur lesquelles s’appuie à la théorie des sondages ne sont plus adaptées, on est obligé d’appliquer des coefficients correcteurs sur les formules, etc.

      Il faut comprendre qu’on a surtout besoin d’échantillons représentatifs quand les populations étudiées sont très nombreuses (ex : 60 millions d’habitants en France) et qu’on ne peut matériellement interroger qu’un petit nombre d’individus, c’est le principe du sondage.

      Si vous devez justifier de votre méthode d’échantillonnage, vous devrez vous documenter davantage pour trouver les arguments.
      En pratique, je pense que votre méthode sera forcément empirique.
      Bon courage !

    6. Bonjour madame!
      Merci vos conseils et votre intervention pour apporter des clarifications aux difficultés que nous rencontrons.
      Excusez moi j’ai suivi votre méthode que vous m’avait proposé et j’ai eu à parcourir vos documents pour le coefficient de correcteur pour une population de taille réduite 220 et la méthode empirique par quotas. Mais j’ai eu des difficultés à tirer la taille l’échantillon.

      Mon coefficient correcteur me donne 140 échantillon à prélever pour une population mère de 220 effectifs. Mais comme j’ai des localités de taille faible 12, 8, 15, 9. J’ai décidé d’enquêter la population totale parce que, en appliquant le coefficient correcteur, cela donne des valeurs égale à la taille de la population mère de chaque localité. Cependant pour la population de taille 120 et 49 quand j’applique la formule pour calculer le coefficient correcteur cela me donne une valeur très élevée.
      n’=n*N/(n+N). Je trouve une valeur approximative de 90 et 46.
      La somme totale me donne 90+46+15+9+8+12 qui est une valeur supérieure à 140 (valeur d’échantillon à prélever en appliquant le coefficient correcteur à la population totale de la zone d’étude).
      S’il vous plaît j’ai des difficultés à prélever la taille d’échantillon par localité.

    7. Bonjour Viviane,

      Je n’ai pas refait vos calculs (je vous fais confiance) mais je ne suis pas surprise par les tailles d’échantillon que vous trouvez car vos effectifs sont très petits.

      Ayez bien en tête que la théorie des sondages repose sur les lois des ‘grands nombres », ou comment obtenir des informations fiables sur une population importante en n’interrogeant qu’un échantillon réduit.

      Dans votre cas, la population est petite, a fortiori les sous-populations.
      La notion même d’échantillon mérite d’être questionnée.
      Une enquête exhaustive serait sans doute plus adaptée mais sans doute avez-vous des contraintes de coût ou de faisabilité.

      Des chercheurs ont mis au point le calcul avec coefficient correcteur pour apporter une solution au cas des petites populations.
      Plus la population est petite, plus la taille de l’échantillon se rapproche de la taille de la population :
      – sur votre population totale de 220, vous trouvez 140, taux de sondage 64%
      – sur une sous-population de 120, vous trouvez 90, taux de sondage 75%
      – sur une sous-population de 49, vous trouvez 46, taux de sondage 94%

      De façon pragmatique, je vous avais suggéré dans un message précédent la méthode suivante :
      – là où il y a peu de producteurs (9), il faut interroger tout le monde : c’est bien ce que vous prévoyez de faire
      – là où ils sont 15 ou 18, essayez d’interroger le maximum de producteurs, disons au moins un producteur sur deux : poussez jusqu’à deux sur trois si vous pouvez
      – là où le nombre de producteurs est plus important, vous pouvez appliquer un taux de sondage dégressif : essayez 30% ou 40%

      Un autre élément important est la dispersion au sein de la population. Les calculs théoriques sont basés sur une dispersion maximale, la formule que je donne dans le blog s’appuie sur une proportion 50/50. Si dans votre cas la dispersion (variance/écart-type) est moindre, la précision de vos résultats sera meilleure avec la même taille d’échantillon. Vous le saurez a posteriori.

      Vous souhaitant le meilleur succès pour votre étude.

    8. Merci beaucoup madame je viens d’appliquer votre méthode pour trouver ma taille d’échantillon qui est 95.
      Mais dans votre réponse vous avez parlé de de ma dispersion (variance/écart-type). Je ne n’ai pas encore effectué mes enquêtes comment pourrai je trouve le taux de dispersion ?

    9. Oui, Viviane, vous ne pourrez connaître la dispersion réelle sur les variables que vous cherchez à estimer qu’une fois l’enquête réalisée.

      Je vais prendre un exemple pour illustrer cela :

      Supposons qu’il y ait deux façons de procéder pour produire des semences, la méthode A et la méthode B et que votre enquête a pour but de savoir quelle proportion de producteurs utilisent la méthode A et la méthode B respectivement.
      Si vous ignorez a priori cette proportion A/B, vous allez calculer la taille de votre échantillon théorique en partant de l’hypothèse la plus défavorable, c’est à dire une dispersion maximale 50/50. Le calcul p x (1-p) qui intervient au numérateur de la formule donne 0,25.
      Une fois l’enquête terminée, vous avez la vraie valeur de la proportion A/B sur l’échantillon interrogé. Imaginons que ce soit 80/20. La dispersion est moindre.
      Vous pouvez renverser la formule de calcul de la taille de l’échantillon pour déterminer la précision de votre estimation. Le calcul p x (1-p) donne 0,16 qui est inférieur à 0,25. Pour une taille d’échantillon connue, la marge d’erreur est donc plus faible.

      En espérant que c’est plus clair pour vous, sinon je vous invite à relire l’article sur la détermination de la taille de l’échantillon.

  18. Bonjour !, Comment trouver la taille de l’échantillon lorsque seulement j’ai un degré de confiance de 95% dont je ne connais pas la proportion à utiliser ausis la marge d’erreur .
    Je souligne que la taille de la population n’est pas aussi connue.

    1. Bonjour Théophile, merci pour votre question.
      Vous trouverez plein d’explications sur les hypothèses à retenir pour le calcul de la taille de l’échantillon en cliquant ici (lisez aussi les commentaires et leurs réponses, cela pourra vous aider).

      Si on résume :
      – la taille de la population n’entre pas en jeu dans le calcul sauf si la population est particulièrement petite (auquel cas on applique un coefficient correcteur) ;
      – vous faites une hypothèse a priori sur le degré de confiance (vous avez choisi 95%), il vous faut aussi faire une hypothèse sur la marge d’erreur qui vous parait acceptable ;
      – avant d’avoir fait l’enquête, il est extrêmement rare que la proportion à estimer soit connue, c’est pourquoi on se place en général dans le cas le plus défavorable, celui où la dispersion est la plus grande, c’est-à-dire une proportion égale 0,50.

      Pour estimer une proportion avec un niveau de confiance de 95% et une marge d’erreur à 5%, il faut interroger un échantillon d’environ 400 individus (le calcul donne très exactement 384,16).

  19. Bonjour Madame Lafont,
    Je vous félicite pour votre et la qualité de votre accompagnement.
    Je voudrais mener une enquête sur des vendeurs informels d’eau ()petits opérateur privés: POP) à Abidjan qui se compose de 13 communes dans lesquelles se trouvent de plusieurs dizaines de quartiers précaires et sous-équipés justifiant le recours aux services de ces revendeurs. Par définition, ces POP sont informels, donc cachés, et il n’exsite pas de base de sondage. On dispose uniquement des effectifs d’habitants des communes (avec répartition par sexe).
    Si on suit la logique, on devrait utiliser un échantillonnage empirique, mais on va perdre en qualité de la représentativité. Mais pour utiliser une méthode empirique comme les quotas on aura besoin aussi d’informations sur ces POP informels, chose qui n’existe pas.
    Est-ce possible de mixer les deux types d’échantillonnages dans ce genre de cas exceptionnels? Par exemple faire:
    1. Un tirage en quotas des communes selon leurs pondérations démographiques
    2. Un tirage en grappe des quartiers à cibler au sein des communes
    3. Au sein des quartiers es POP seront rires selon un mode de convenance (disponibilité des POP).

    Si vous avez d’autres suggestions, je reste à l’écoute.

    D’avance merci pour votre prompte réponse!

    1. Merci Hicham pour votre message. La description de votre problématique est claire et votre analyse pertinente. Je ne peux qu’essayer de vous apporter quelques éclaircissements.

      Un premier point : pour votre enquête, vous allez interroger les vendeurs d’eau (POP), une population pour laquelle il n’existe pas de base de sondage ni de données statistiques puisque, comme vous l’indiquez, c’est une activité informelle. Vous n’avez alors pas d’autre choix que de constituer un échantillon de convenance en allant à la rencontre des revendeurs sur le terrain.
      S’agissant du choix des quartiers dans lesquels vous allez interroger les revendeurs, vous pouvez en effet utiliser différentes méthodes pour les sélectionner, par exemple un tirage par grappes.

      Quant aux quotas, ce n’est pas au sens strict une méthode de « tirage » d’un échantillon mais une méthode empirique pour constituer des échantillons représentatifs de certaines caractéristiques de la population étudiée. Or vous n’avez pas d’information a priori sur les caractéristiques des vendeurs d’eau (âge, sexe, ancienneté dans le métier, volume d’eau vendue ou niveau de revenu par exemple).

      L’intérêt des statistiques que vous avez sur le nombre d’habitants des 13 communes qui composent Abidjan, c’est de vous aider à déterminer combien de quartiers doivent être enquêtés par commune pour respecter la répartition de la population (je parle ici des habitants de la ville, pas de la population au sens échantillonnage). Mais, encore une question de terminologie, vous ne pouvez pas dire que vous allez faire un « tirage en quotas des communes ».

      Au final, votre approche méthodologique est forcément empirique. Le choix des quartiers enquêtés (que vous devrez pouvoir justifier lorsque vous tirerez les conclusions de l’étude) en constitue l’enjeu majeur. Essayez de sélectionner des quartiers présentant des caractéristiques diversifiées : taille, accessibilité, infrastructures et équipements, type d’habitat, niveau de vie des habitants, etc. (ce sont des exemples que je vous donne ici, ce ne sont pas forcément les critères adaptés à l’objectif de votre enquête que je ne connais pas). Ces caractéristiques des quartiers, vous les connaissez peut-être a priori, sinon demandez aux enquêteurs de les relever lors des interviews. Par exemple, faites-leur noter à quel endroit le vendeur d’eau se trouve, comment est l’habitat à cet endroit. Bien briefés, les enquêteurs peuvent recueillir des informations précieuses.

      Vous souhaitant le meilleur succès dans votre projet.

  20. Bonjour Madame Lafont,
    J’aimerais comprendre votre formule pour l’appliquer sur mon échantillon, que vous m’aidiez à trouver la méthode de l’échantillonnage

    j’explique mon cas, j’ai une base de sondage de 219 des agriculteurs à enquêter dans 2 zones et la proportion des agriculteurs dans ces 2 zones est 2000. Que faire et quel sera la méthode?

    1. Merci Véra de votre intérêt pour mes articles du blog de Questio.

      Je pense que vous voulez dire que vous avez une base de sondage datant de 2019 comprenant 2000 agriculteurs à enquêter, répartis dans 2 zones.

      Vous comprenez bien que pour construire un plan d’échantillonnage, il faut travailler de façon approfondie sur la population étudiée à partir de vos connaissances préexistantes.

      La méthode d’échantillonnage à retenir dépendra de plusieurs facteurs.

      Si votre base de sondage est fiable et à jour, et si votre méthode de recueil des réponses vous assure que les agriculteurs sélectionnés pour l’échantillon vont répondre (méthode avec enquêteur, via un organisme officiel par exemple), vous pouvez partir sur une méthode aléatoire avec un tirage au hasard, ou un tirage systématique à votre convenance. Comme il y a 2 zones, vous pouvez affiner la méthode en tirant un échantillon aléatoire dans chaque zone. La formule de calcul de la taille de l’échantillon vous permet de calculer combien d’agriculteurs doivent être enquêtés dans chaque zone en fonction de la précision et de l’intervalle de confiance attendus au niveau des résultats.

      Inversement, si votre base de sondage n’est pas forcément à jour ou exhaustive, mais que vous disposez de données statistiques sur la population des agriculteurs présents dans les 2 zones, partez plutôt sur la méthode des quotas en retenant comme variables la localisation (zone 1 ou zone 2) et une ou deux autres variables importantes pour caler l’échantillon.

      Enfin, s’il s’avère que l’échantillon des répondants a été mal contrôlé en amont ou pendant la phase de recueil des réponses, il est envisageable de procéder a posteriori à un redressement statistique des résultats.

      En espérant que ces informations vous aident à avancer dans votre projet.

  21. Bonjour Madame,
    Merci pour votre aide.
    Je prepare une these de doctorat sur le comportement discursif des medias face aux discours d’un chef d’etat.
    J’ai combien de population de ce sujet?
    Quelle technique d’echantillonnage utilisee svp?

    1. Bonjour Charles et merci de votre intérêt pour notre blog et particulièrement cet article.

      Je m’attache à répondre à toutes les questions qui me sont posées mais là, vraiment, c’est à vous de répondre à cette question. Quelle est la population qui fait l’objet de votre étude ? Est-ce la population générale, par exemple en France nous sommes environ 70 millions d’habitants y compris les enfants (peut-être faut-il soustraire les moins de 18 ans) ? Ou est-ce les médias que vous souhaitez interroger ? S’agit-il d’une étude dans plusieurs pays ? Etc.

      Une fois que vous aurez identifié la population, là vous pourrez commencer à envisager la méthode d’échantillonnage à retenir en fonction de votre problématique et des données disponibles (existence ou non d’une base de sondage par exemple).

      Je vous invite à réfléchir aux 5 questions préalables avant de vous lancer et je vous souhaite le meilleur succès dans vos études.

Les commentaires sont clos.