Étape 2 : Construction de l'échantillon : Choix de la taille de l'échantillon
Définition :
Un échantillon est un sous-ensemble de la population étudiée. La validité des résultats de l'enquête dépend, à ce stade, de la représentativité de l'échantillon, c'est-à-dire de la possibilité d'étendre les conclusions de l'enquête à l'ensemble de la population cible.
Un recensement consisterait à interroger toutes les unités de base du sondage, soit la totalité des individus ou entreprises constituant la population de base. Dans la pratique, cette situation n'existe pas. Ainsi, la taille de l'échantillon résulte d'un compromis entre le budget, et le degré de fiabilité souhaité, la nature de la population et du problème commercial étudié.
Un sondage est considéré comme exhaustif lorsque sa taille est supérieure au 1/7 de la population de base. Cette situation se rencontre rarement, sauf dans le domaine industriel.
Le sondage sera d'autant plus valable que la taille de l'échantillon sera grande.
En effet la validité statistique d'un sondage est davantage liée à la taille absolue de l'échantillon qu'au rapport existant entre la taille de l'échantillon et la taille de la population totale.
Méthode : Calcul d'un échantillon
soient :
n : taille à déterminer de l'échantillon,
t : coefficient pour le seuil de confiance donné (si l'objectif est un seuil de 95% de confiance, choisi en général, alors t = 1,96)
p : proportion observée dans une population mère (dans le doute, poser p = 50 %)
q = 1 – p
ε = erreur acceptée (exemple +/- 5 % de marge d'erreur, classiquement choisi)
Alors N°1 : n >( t² x (p x q)) / ε² | t = constante correspondant à p, liée à la fonction de Laplace-Gauss p = seuil de confiance ε = erreur maximum acceptée | Alors N°2 : > (t2 x (1- p)) / ε² |
Exemple :
Soient P = 50 %, seuil de confiance = 95 %, marge d'erreur = 5%, Alors : N > 1,962 x (0,5 x 0,5) soit n > 384, 16 personnes seront à interroger
La marge d'erreur correspond à la précision acceptable des calculs (plus elle est faible, plus l'échantillon augmente).
Le seuil de confiance correspond à la représentativité des unités de sondage prélevées.