Dans le monde des enquêtes d’opinion, la représentativité de l’échantillon est un enjeu majeur. Pour ajuster les résultats, on utilise généralement des techniques de redressement, dont la plus connue est le calage sur marges. Mais que faire lorsqu’un client exprime la volonté de ne pas y recourir ?
C’est précisément le cas que nous avons rencontré lors d’une enquête interne auprès d’environ 2.500 salariés : le client de Questio souhaitait obtenir des résultats fiables, mais sans « manipulation » a posteriori.
Ce client ne voulait pas accorder un poids plus important à certains répondants et un poids moins important à d’autres. Il faut dire également qu’une catégorie de salariés avait beaucoup moins participé à l’enquête que les autres catégories, ce qui aurait conduit à les sur-pondérer de façon importante dans le redressement.
Pour répondre à cette demande, nous avons adopté une solution alternative, inspirée des méthodes bootstrap, qui consiste à exploiter plusieurs sous-échantillons.

questionnaire-pro, logiciel d'enquêtes édité par Questio
Graphiques personnalisables, module de tris croisés, rapport d’enquête ou export des données au choix
Petit rappel : qu’est-ce que le calage sur marges ?
Le calage sur marges est une méthode de redressement statistique qui consiste à attribuer un poids (ou pondération) à chaque répondant de telle sorte que la distribution de l’échantillon corresponde à celle de la population de référence, selon certaines variables de contrôle (par exemple : sexe, âge, région, etc.).
Travailler sur un échantillon représentatif de la population étudiée permet d’extrapoler les résultats obtenus sur l’échantillon à la population toute entière. Les algorithmes de calage sur marges sont couramment utilisés pour redresser les échantillons dans les enquêtes d’opinion. Leurs atouts majeurs :
- ce type de redressement permet d’obtenir des résultats représentatifs de la population cible,
- les méthodes statistiques sur lesquelles on s’appuie sont largement théorisées et leur pratique est éprouvée.

A LIRE AUSSI
Redressement d’échantillons : exemple et méthodes (1/2)
Pourquoi redresser un échantillon et dans quelles conditions ce redressement est-il possible ? Quelles méthodes s’offrent au statisticien ? Des réponses dans cet article en deux parties […] Lire la suite
La principale limite à la mise en œuvre d’un redressement par calage sur marges est la nécessité de disposer de données de référence fiables pour les variables de contrôle de l’échantillon.
L’autre limite, qui est celle à laquelle nous nous sommes heurtés avec notre client, c’est qu’un tel redressement peut être perçu comme une intervention lourde, voire comme une « correction » artificielle des réponses.
Notre solution consistant à tirer plusieurs sous-échantillons
Face à la demande de notre client, nous avons proposé de mettre en place une démarche différente, que l’on peut résumer en trois étapes :
Identification des variables de contrôle
Comme dans le calage classique, il s’agit de définir les variables qui structurent l’échantillon. Dans notre cas, ces variables étaient définies en amont de l’enquête et présentes dans le fichier source des salariés à interroger : direction/service de rattachement, poste occupé, ancienneté et sexe.
Tirage de sous-échantillons
À partir de l’échantillon global obtenu, nous avons tiré un grand nombre de sous-échantillons, en veillant à ce qu’ils respectent la distribution observée des variables de contrôle. Dans notre cas, comme indiqué plus haut, une catégorie de salariés n’avait que très peu participé à l’enquête, donc tous les répondants de cette catégorie étaient d’office inclus dans chaque sous-échantillon : nous avons déterminé la taille du sous-échantillon en fonction du poids de cette catégorie dans la population. Puis on a tiré aléatoirement des répondants dans toutes les autres catégories de salariés.
Calcul des résultats finaux
Pour chaque sous-échantillon, nous avons pris la distribution des réponses à chaque question du questionnaire (ou réponse moyenne, selon le type de question). Et nous avons agrégé les résultats, en prenant la moyenne des résultats de tous les sous-échantillons pour produire le résultat final.
Cette méthode permet de lisser les fluctuations statistiques tout en respectant la structure réelle des données collectées.
Exemple simplifié
Imaginons une enquête interne auprès des salariés d’une entreprise, avec 1.000 répondants, sachant que l’effectif total de l’entreprise se répartit entre 60 % de femmes et 40 % d’hommes.
Nous tirons 50 sous-échantillons de 400 répondants, chacun respectant la proportion observée (60/40).
Pour chaque sous-échantillon, nous calculons le taux de satisfaction moyen à la question : Êtes-vous satisfait de vos conditions de travail ?
Les résultats fluctuent légèrement (par exemple de 71% à 75% selon les sous-échantillons).
En agrégeant ces moyennes, nous obtenons un score final robuste, par exemple 73,4%.
Cette approche donne au client un résultat clair, directement basé sur la structure de son échantillon, sans pondération artificielle.
Le lien avec le bootstrap (technique statistique)
Le bootstrap, en statistique, est une méthode qui consiste à tirer de multiples échantillons, avec remise, à partir d’un échantillon initial, afin d’estimer la variabilité d’une statistique.
Notre méthode décrite ci-dessus en reprend l’esprit : multiplier les tirages pour obtenir une estimation robuste. Mais elle s’en distingue par deux aspects :
- Les sous-échantillons sont construits de façon à refléter la distribution des variables de contrôle.
- L’objectif n’est pas d’évaluer l’incertitude (liée aux variations entre les différentes estimations des sous-échantillons), mais de produire une estimation moyenne plus stable.
En ce sens, il s’agit d’une adaptation pratique du bootstrap aux enquêtes d’opinion.
Pourquoi notre méthode dérivée du bootstrap est intéressante
L’approche présentée dans cet article a des atouts indéniables :
- transparence : les résultats reposent uniquement sur les données collectées, sans pondération ajoutée.
- simplicité : facile à expliquer et à comprendre pour des non-statisticiens.
- robustesse : l’agrégation de multiples sous-échantillons réduit les effets du hasard.
- acceptabilité client : répond aux attentes de ceux qui souhaitent éviter les redressements traditionnels.
Cependant, comme toute méthode, celle-ci a ses limites. Tout d’abord, elle ne corrige pas un échantillon trop fortement biaisé par rapport à la population cible. Cela dit, c’est un peu vrai de toutes les méthodes de redressement d’échantillon, elles ne peuvent pas corriger tous les biais.
Ensuite, le choix du nombre de sous-échantillons et de leur taille influe sur la stabilité du résultat : plus ils sont nombreux, plus l’estimation est robuste.

A LIRE AUSSI
L’exigence de représentativité de l’échantillon, différents cas de figure
La représentativité des échantillons est un enjeu majeur dans le monde des études, voire une exigence absolue pour certains types de sondages. Mais les cas de figure sont nombreux et variés […] Lire la suite
L’enquête interne menée pour notre client constitue un cas d’usage typique :
- respecter sa volonté de ne pas redresser par les méthodes classiques de calage sur marges qui peuvent être perçues comme complexes,
- gagner sa confiance grâce à une démarche statistique claire et transparente,
- produire des résultats robustes et cohérents, faciles à présenter à l’ensemble des salariés.
Chez Questio, nous savons que chaque client a ses contraintes et ses sensibilités. Certains souhaitent recourir aux méthodes classiques de redressement, d’autres préfèrent au contraire conserver les données telles qu’elles ont été collectées.
Notre rôle est d’apporter la souplesse méthodologique nécessaire pour transformer les données en informations exploitables, en respectant les attentes et la confiance de nos clients. Cette approche inspirée du bootstrap n’est peut-être pas une panacée universelle, mais elle constitue une alternative pragmatique et efficace lorsque le calage sur marges n’est pas souhaité.
Questio propose à ses clients un accompagnement et des prestations de service ou développements sur-mesure pour les enquêtes, sondages et auto-diagnostics digitaux, en s’appuyant sur sa plateforme d’enquêtes interne questionnaire-pro.
Vous souhaitez en savoir plus sur nos services logiciels ou nos méthodes d’analyse d’enquêtes et découvrir la solution la mieux adaptée à vos besoins ? Contactez-nous, nous serons ravis d’en discuter.
Cet article vous a intéressé ? Vous avez des questions d’ordre général ou des commentaires à ajouter ? N’hésitez pas à vous exprimer, je m’attache à répondre à toutes les demandes.