- Formules et équations
- Comment calculer l'erreur d'échantillonnage
- Pour un niveau de confiance
- Exemples
- - Exemple 1
- Solution
- - Exemple 2
- Solution
- - Exemple 3
- Solution
- - Exemple 4
- Solution
- - Exercice 5
- Solution
- Références
L' erreur d' échantillonnage ou l' erreur d' échantillonnage dans les statistiques est la différence entre la valeur moyenne d'un échantillon et la valeur moyenne de la population totale. Pour illustrer l'idée, imaginons que la population totale d'une ville soit d'un million de personnes, dont vous voulez sa pointure moyenne, pour laquelle un échantillon aléatoire de mille personnes est prélevé.
La taille moyenne qui émerge de l'échantillon ne coïncidera pas nécessairement avec celle de la population totale, même si si l'échantillon n'est pas biaisé, la valeur doit être proche. Cette différence entre la valeur moyenne de l'échantillon et celle de la population totale est l'erreur d'échantillonnage.
Figure 1. Puisque l'échantillon est un sous-ensemble de la population totale, la moyenne de l'échantillon a une marge d'erreur. Source: F. Zapata.
La valeur moyenne de la population totale est généralement inconnue, mais il existe des techniques pour réduire cette erreur et des formules pour estimer la marge d'erreur d'échantillonnage qui seront abordées dans cet article.
Formules et équations
Disons que nous voulons connaître la valeur moyenne d'une certaine caractéristique mesurable x dans une population de taille N, mais puisque N est un grand nombre, il n'est pas possible de réaliser l'étude sur la population totale, alors nous procédons à un échantillon aléatoire de taille n <
La valeur moyenne de l'échantillon est notée
Supposons que m échantillons soient prélevés sur la population totale N, tous de taille égale n avec des valeurs moyennes
Ces valeurs moyennes ne seront pas identiques les unes aux autres et seront toutes autour de la valeur moyenne de la population μ. La marge d'erreur d'échantillonnage E indique la séparation attendue des valeurs moyennes
La marge d'erreur standard ε de l'échantillon de taille n est:
ε = σ / √n
où σ est l'écart type (la racine carrée de la variance), qui est calculé à l'aide de la formule suivante:
σ = √
La signification de la marge d'erreur standard ε est la suivante:
Valeur moyenne
Comment calculer l'erreur d'échantillonnage
Dans la section précédente, la formule pour trouver la marge d'erreur standard d'un échantillon de taille n a été donnée, où le mot standard indique qu'il s'agit d'une marge d'erreur avec une confiance de 68%.
Cela indique que si de nombreux échantillons de même taille n ont été prélevés, 68% d'entre eux donneront des valeurs moyennes
Il existe une règle simple, appelée règle 68-95-99.7, qui nous permet de trouver facilement la marge d'erreur d'échantillonnage E pour des niveaux de confiance de 68%, 95% et 99,7%, puisque cette marge est de 1⋅ ε, 2 ⋅ ε et 3⋅ ε respectivement.
Pour un niveau de confiance
Si le niveau de confiance γ n'est pas l'un des ci-dessus, alors l'erreur d'échantillonnage est l'écart type σ multiplié par le facteur Zγ, qui est obtenu par la procédure suivante:
1.- Tout d'abord, le niveau de signification α est déterminé, qui est calculé à partir du niveau de confiance γ par la relation suivante: α = 1 - γ
2.- Ensuite, il faut calculer la valeur 1 - α / 2 = (1 + γ) / 2, qui correspond à la fréquence normale accumulée entre -∞ et Zγ, dans une distribution normale ou gaussienne typée F (z), dont la définition peut être vu dans la figure 2.
3.- L'équation F (Zγ) = 1 - α / 2 est résolue au moyen des tableaux de la distribution normale (cumulative) F, ou au moyen d'une application informatique qui a la fonction gaussienne inverse F -1.
Dans ce dernier cas, nous avons:
Zγ = G -1 (1 - α / 2).
4.- Enfin, cette formule est appliquée pour l'erreur d'échantillonnage avec un niveau de fiabilité γ:
E = Zγ ⋅ (σ / √n)
Figure 2. Tableau de distribution normale. Source: Wikimedia Commons.
Exemples
- Exemple 1
Calculez la marge d'erreur standard dans le poids moyen d'un échantillon de 100 nouveau-nés. Le calcul du poids moyen était
Solution
La marge d'erreur standard est ε = σ / √n = (1500 kg) / √100 = 0,15 kg. Cela signifie qu'avec ces données, on peut déduire que le poids de 68% des nouveau-nés est compris entre 2 950 kg et 3,25 kg.
- Exemple 2
Déterminez la marge d'erreur d'échantillonnage E et la fourchette de poids de 100 nouveau-nés avec un niveau de confiance de 95% si le poids moyen est de 3 100 kg avec un écart type σ = 1 500 kg.
Solution
Si la règle 68 s'applique; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε, nous avons:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
En d'autres termes, 95% des nouveau-nés auront un poids compris entre 2 800 kg et 3 400 kg.
- Exemple 3
Déterminez la plage de poids des nouveau-nés dans l'exemple 1 avec une marge de confiance de 99,7%.
Solution
L'erreur d'échantillonnage avec une confiance de 99,7% est de 3 σ / √n, ce qui pour notre exemple est E = 3 * 0,15 kg = 0,45 kg. De là, il s'ensuit que 99,7% des nouveau-nés auront un poids compris entre 2 650 kg et 3 550 kg.
- Exemple 4
Déterminez le facteur Zγ pour un niveau de confiance de 75%. Déterminez la marge d'erreur d'échantillonnage avec ce niveau de fiabilité pour le cas présenté dans l'exemple 1.
Solution
Le niveau de confiance est γ = 75% = 0,75, ce qui est lié au niveau de signification α par la relation γ = (1 - α), de sorte que le niveau de signification est α = 1 - 0,75 = 0, 25.
Cela signifie que la probabilité normale cumulée entre -∞ et Zγ est:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Ce qui correspond à une valeur Zγ de 1,1503, comme le montre la figure 3.
Figure 3. Détermination du facteur Zγ correspondant à un niveau de confiance de 75%. Source: F. Zapata via Geogebra.
En d'autres termes, l'erreur d'échantillonnage est E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Lorsqu'il est appliqué aux données de l'exemple 1, il donne une erreur de:
E = 1,15 * 0,15 kg = 0,17 kg
Avec un niveau de confiance de 75%.
- Exercice 5
Quel est le niveau de confiance si Z α / 2 = 2,4?
Solution
P (Z ≤ Z α / 2) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Le niveau de signification est:
α = 0,0164 = 1,64%
Et enfin, le niveau de confiance demeure:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Références
- Canavos, G. 1988. Probabilité et statistiques: applications et méthodes. McGraw Hill.
- Devore, J. 2012. Probabilité et statistiques pour l'ingénierie et la science. 8ème. Édition. Cengage.
- Levin, R. 1988. Statistiques pour les administrateurs. 2ème. Édition. Prentice Hall.
- Sudman, S. 1982. Poser des questions: un guide pratique pour la conception de questionnaires. San Francisco. Jossey Bass.
- Walpole, R. 2007. Probabilité et statistiques pour l'ingénierie et les sciences. Pearson.
- Wonnacott, TH et RJ Wonnacott. 1990. Statistiques préliminaires. 5e éd. Wiley
- Wikipédia. Erreur d'échantillonnage. Récupéré de: en.wikipedia.com
- Wikipédia. Marge d'erreur. Récupéré de: en.wikipedia.com