L' erreur standard d'estimation mesure l'écart dans une valeur de population échantillon. Autrement dit, l'erreur standard d'estimation mesure les variations possibles de la moyenne de l'échantillon par rapport à la valeur réelle de la moyenne de la population.
Par exemple, si vous voulez connaître l'âge moyen de la population d'un pays (moyenne de la population), vous prenez un petit groupe d'habitants, que nous appellerons un «échantillon». À partir de là, on extrait l'âge moyen (moyenne de l'échantillon) et on suppose que la population a cet âge moyen avec une erreur-type d'estimation qui varie plus ou moins.
MW Toews
Il est à noter qu'il est important de ne pas confondre l'écart-type avec l'erreur-type et avec l'erreur-type d'estimation:
1- L'écart type est une mesure de la dispersion des données; c'est-à-dire qu'il s'agit d'une mesure de la variabilité de la population.
2- L'erreur type est une mesure de la variabilité de l'échantillon, calculée en fonction de l'écart type de la population.
3- L'erreur standard d'estimation est une mesure de l'erreur commise lors de la prise de la moyenne de l'échantillon comme estimation de la moyenne de la population.
Comment est-il calculé?
L'erreur standard d'estimation peut être calculée pour toutes les mesures obtenues dans les échantillons (par exemple, erreur standard d'estimation de la moyenne ou erreur standard d'estimation de l'écart type) et mesure l'erreur qui est faite lors de l'estimation du vrai mesure de la population à partir de sa valeur d'échantillon
L'intervalle de confiance de la mesure correspondante est construit à partir de l'erreur standard d'estimation.
La structure générale d'une formule pour l'erreur type d'estimation est la suivante:
Erreur standard d'estimation = ± coefficient de confiance * Erreur standard
Coefficient de confiance = valeur limite d'une statistique d'échantillon ou d'une distribution d'échantillonnage (cloche normale ou gaussienne, t de Student, entre autres) pour un certain intervalle de probabilité.
Erreur standard = écart type de la population divisé par la racine carrée de la taille de l'échantillon.
Le coefficient de confiance indique le nombre d'erreurs standard que vous êtes prêt à ajouter et à soustraire à la mesure pour avoir un certain niveau de confiance dans les résultats.
Exemples de calcul
Supposons que vous essayez d'estimer la proportion de personnes dans la population qui ont un comportement A et que vous voulez avoir 95% de confiance dans vos résultats.
Un échantillon de n personnes est prélevé et la proportion de l'échantillon p et son complément q sont déterminés.
Erreur standard d'estimation (SEE) = ± coefficient de confiance * Erreur standard
Coefficient de confiance = z = 1,96.
Erreur standard = racine carrée du rapport entre le produit de la proportion de l'échantillon et son complément et la taille de l'échantillon n.
À partir de l'erreur standard d'estimation, l'intervalle dans lequel la proportion de population devrait être trouvée ou la proportion d'échantillons d'autres échantillons qui peuvent être formés à partir de cette population est établie, avec un niveau de confiance de 95%:
p - EEE ≤ Proportion de la population ≤ p + EEE
Exercices résolus
Exercice 1
1- Supposons que vous essayez d'estimer la proportion de personnes dans la population qui ont une préférence pour les préparations lactées enrichies et que vous voulez avoir une confiance de 95% dans vos résultats.
Un échantillon de 800 personnes est prélevé et il est déterminé que 560 personnes de l'échantillon ont une préférence pour la formule de lait enrichie. Déterminer un intervalle dans lequel on peut s'attendre à trouver la proportion de population et la proportion d'autres échantillons pouvant être prélevés dans la population, avec une confiance de 95%
a) Calculons la proportion de l'échantillon p et son complément:
p = 560/800 = 0,70
q = 1 - p = 1 - 0,70 = 0,30
b) On sait que la proportion se rapproche d'une distribution normale pour les grands échantillons (supérieurs à 30). Ensuite, la soi-disant règle 68-95-99.7 est appliquée et nous devons:
Coefficient de confiance = z = 1,96
Erreur standard = √ (p * q / n)
Erreur standard d'estimation (SEE) = ± (1,96) * √ (0,70) * (0,30) / 800) = ± 0,0318
c) À partir de l'erreur-type d'estimation, l'intervalle dans lequel la proportion de la population devrait être trouvée avec un niveau de confiance de 95% est établi:
0,70 - 0,0318 ≤ Proportion de la population ≤ 0,70 + 0,0318
0,6682 ≤ Proportion de la population ≤ 0,7318
Vous pouvez vous attendre à ce que la proportion de l'échantillon de 70% change de 3,18 points de pourcentage si vous prenez un échantillon différent de 800 individus ou si la proportion réelle de la population se situe entre 70 - 3,18 = 66,82% et 70 + 3,18 = 73,18%.
Exercice 2
2- Nous prendrons de Spiegel et Stephens, 2008, l'étude de cas suivante:
Un échantillon aléatoire de 50 notes a été prélevé sur les notes totales en mathématiques des étudiants de première année d'une université, dans laquelle la moyenne trouvée était de 75 points et l'écart type de 10 points. Quelles sont les limites de confiance de 95% pour l'estimation des notes moyennes en mathématiques au collège?
a) Calculons l'erreur standard d'estimation:
95% coefficient de confiance = z = 1,96
Erreur standard = s / √n
Erreur standard d'estimation (SEE) = ± (1,96) * (10√50) = ± 2,7718
b) À partir de l'erreur standard d'estimation, on établit l'intervalle dans lequel la moyenne de la population ou la moyenne d'un autre échantillon de taille 50, avec un niveau de confiance de 95%, est établie:
50 - 2.7718 ≤ Moyenne de la population ≤ 50 + 2.7718
47,2282 ≤ Moyenne de la population ≤ 52,7718
c) On peut s'attendre à ce que la moyenne de l'échantillon change de 2,7718 points si un échantillon différent de 50 notes est prélevé ou si les notes moyennes réelles en mathématiques de la population universitaire se situent entre 47,2282 points et 52,7718 points.
Références
- Abraira, V. (2002). Écart type et erreur standard. Magazine Semergen. Récupéré de web.archive.org.
- Rumsey, D. (2007). Statistiques intermédiaires pour les nuls. Wiley Publishing, Inc.
- Salinas, H. (2010). Statistiques et probabilités. Récupéré de mat.uda.cl.
- Sokal, R.; Rohlf, F. (2000). Biométrie. Les principes et la pratique des statistiques dans la recherche biologique. Troisième éd. Éditions Blume.
- Spiegel, M.; Stephens, L. (2008). Statistiques. Quatrième éd. McGraw-Hill / Interamericana de México SA
- Wikipédia. (2019). Règle 68-95-99.7. Récupéré de en.wikipedia.org.
- Wikipédia. (2019). Erreur standard. Récupéré de en.wikipedia.org.