Sondages par choix raisonné : quotas et autres

Quotas et autres sondages non aléatoires

Le hasard a un défaut : il est hasardeux. Alors, non contents de le mesurer, les statisticiens ont décidé de le domestiquer.

Comment ? En travaillant sur des échantillons dont la composition est plus ou moins forcée.

Pourquoi ? La possibilité n’est pas toujours offerte d’extraire un échantillon aléatoire d’une population mère, notamment quand on a des difficultés à localiser les individus. Et même lorsque le sondage aléatoire est envisageable, on n’est pas insensible à quelques menus avantages tels un coût réduit, la rapidité, l’absence de base de sondage et une meilleure précision si l’échantillon est petit. Le principal inconvénient est l’impossibilité d’utiliser bon nombre de techniques statistiques et notamment les intervalles de confiance.

Alors, lorsqu’on doit mener une enquête, en particulier pour les études de marché, on ruse…

À définir au préalable

Que le sondage soit aléatoire ou par choix raisonné, on définit d’abord la population et la taille de l’échantillon. Dans la cadre du choix raisonné, on détermine aussi la représentativité de cet échantillon. Une technique souvent utilisée est la méthode des quotas.

Les quotas

Cette méthode empirique repose sur l’hypothèse de corrélation entre différentes caractéristiques d’une population, hypothèse qui a pu être validée lors d’une précédente étude (test d’indépendance du khi², matrice des corrélations…).

Les caractères retenus sont appelés variables de contrôle. Il faut connaître leurs distributions dans la population mère pour les reproduire dans l’échantillon. Par ailleurs, elles doivent être facilement vérifiables par l’enquêteur (ce qui exclut le revenu comme choix de variable de contrôle !). La tranche d’âge, le sexe, le code PCS, la région et la taille de la commune servent souvent à établir les quotas d’individus. Les variables de contrôle utilisées sur un échantillon de points de vente seront l’activité, le nombre de salariés, la taille de la commune…

Exemple : population composée à \(51\%\) de femmes et à \(20\%\) d’habitants de villes de plus de 20 000 habitants, échantillon de 800 individus : l’enquêteur interrogera \(800 × 0,51 × 0,2\) \(=\) \(82\) citadines.

Le problème est que l’on n’est jamais certain de la représentativité de l’échantillon, une liaison entre l'objet de l'enquête et une caractéristique pouvant passer inaperçue...

Exemple de grille. L'enquêteur a déjà interviewé sept personnes sur vingt.

fiche d'enquête

Autres types de sondages

L’échantillon de convenance : pratique et bon marché, cet échantillon n'est pas statistiquement représentatif, avec tous les risques que cela comporte. Utilisé pour des études exploratoires, ce type d’échantillonnage n’est pas recommandé pour induire des conclusion sur l’ensemble d'une population. Les enquêtes en sortie de lieu fermé (aux caisses des supermarchés…) s’apparentent à ce type de sondage.

interview

La méthode des itinéraires (ou méthode de Politz) : un itinéraire est ici imposé à l’enquêteur. Elle évite la tentation d’aller au plus simple en interrogeant trop de répondants au même endroit, ce qui peut être source de biais. Mais elle reste difficile à appliquer, surtout si est combinée à une méthode des quotas.

L’échantillon boule de neige : pour connaître une population très spécifique, on peut utiliser le parrainage ou, d’une manière générale, les amis ou collègues des répondants. Également utilisé dans le B to B. Bon marché mais il ne faut pas être pressé…

Les sondages en ligne où chacun répond ou non selon son envie font partie du paysage d'Internet. Là encore, l'absence de représentativité statistique peut être source de biais importants.

Le panel est un échantillon permanent, constitué par quotas ou de façon aléatoire stratifiée.

enquêteur