- Exemples de quasi-variance
- Pourquoi diviser par n-1?
- Méthode alternative pour calculer la quasivariance
- Le score standard
- Exercice résolu
- Solution pour
- Solution b
- Références
Le quasivariance, la variance ou quasi variance non biaisée est une mesure statistique de la dispersion des données échantillon par rapport à la moyenne. L'échantillon, à son tour, consiste en une série de données extraites d'un univers plus vaste, appelé population.
Il est noté de plusieurs manières, ici s c 2 a été choisi et la formule suivante est utilisée pour le calculer:
Figure 1. La définition de la quasi-variance. Source: F. Zapata.
Où:
La quasi-variance est similaire à la variance s 2, à la seule différence que le dénominateur de la variance est n-1, tandis que le dénominateur de la variance n'est divisé que par n. Il est évident que lorsque n est très grand, les valeurs des deux ont tendance à être les mêmes.
Lorsque vous connaissez la valeur de la quasi-variance, vous pouvez immédiatement connaître la valeur de la variance.
Exemples de quasi-variance
Souvent, vous souhaitez connaître les caractéristiques de toute population: les personnes, les animaux, les plantes et en général tout type d'objet. Mais analyser l'ensemble de la population peut ne pas être une tâche facile, surtout si le nombre d'éléments est très important.
Des échantillons sont ensuite prélevés, dans l'espoir que leur comportement reflète celui de la population et ainsi pouvoir en faire des inférences, grâce à laquelle les ressources sont optimisées. C'est ce qu'on appelle l'inférence statistique.
Voici quelques exemples dans lesquels la quasi-variance et le quasi-écart-type associé servent d'indicateur statistique en indiquant dans quelle mesure les résultats obtenus sont éloignés de la moyenne.
1.- Le directeur marketing d'une entreprise qui fabrique des batteries automobiles a besoin d'estimer, en mois, la durée de vie moyenne d'une batterie.
Pour ce faire, il sélectionne au hasard un échantillon de 100 batteries achetées de cette marque. L'entreprise tient un registre des détails des acheteurs et peut les interroger pour savoir combien de temps durent les piles.
Figure 2. La quasi-variance est utile pour faire des inférences et contrôler la qualité. Source: Pixabay.
2.- La direction académique d'une institution universitaire doit estimer les inscriptions de l'année suivante, en analysant le nombre d'étudiants qui devraient réussir les matières qu'ils étudient actuellement.
Par exemple, dans chacune des sections en cours de Physique I, la direction peut sélectionner un échantillon d'étudiants et analyser leurs performances dans cette chaire. De cette façon, vous pouvez déduire le nombre d'étudiants qui suivront Physique II au cours de la prochaine période.
3.- Un groupe d'astronomes concentre son attention sur une partie du ciel, où un certain nombre d'étoiles avec certaines caractéristiques sont observées: taille, masse et température par exemple.
On se demande si les étoiles d'une autre région similaire auront les mêmes caractéristiques, même les étoiles d'autres galaxies, comme les nuages magellaniques voisins ou Andromède.
Pourquoi diviser par n-1?
Dans la quasivariance, elle est divisée par n-1 au lieu de n et c'est parce que la quasivariée est un estimateur sans biais, comme cela a été dit au début.
Il arrive qu'à partir d'une même population, il soit possible d'extraire de nombreux échantillons. La variance de chacun de ces échantillons peut également être moyennée, mais la moyenne de ces variances ne s'avère pas égale à la variance de la population.
En fait, la moyenne des variances de l'échantillon tend à sous-estimer la variance de la population, à moins que n-1 ne soit utilisé dans le dénominateur. On peut vérifier que l'espérance de la quasi-variance E (s c 2) est précisément s 2.
Pour cette raison, on dit que la quasivariée est sans biais et constitue un meilleur estimateur de la variance de la population s 2.
Méthode alternative pour calculer la quasivariance
On montre facilement que la quasivariance peut également être calculée comme suit:
s c 2 = -
Le score standard
En ayant l'écart d'échantillon, nous pouvons dire combien d'écarts-types une valeur particulière x a, soit au-dessus ou en dessous de la moyenne.
Pour cela, l'expression sans dimension suivante est utilisée:
Score standard = (x - X) / s c
Exercice résolu
863 903 957 1041 1138 1204 1354 1624 1698 1745 1802 1883
a) Utilisez la définition de la quasi-variance donnée au début et vérifiez également le résultat en utilisant la forme alternative donnée dans la section précédente.
b) Calculez le score standard du deuxième élément de données, en le lisant de haut en bas.
Solution pour
Le problème peut être résolu à la main à l'aide d'une calculatrice simple ou scientifique, pour laquelle il est nécessaire de procéder dans l'ordre. Et pour cela, rien de mieux que d'organiser les données dans un tableau comme celui présenté ci-dessous:
Grâce au tableau, les informations sont organisées et les quantités qui vont être nécessaires dans les formules sont à la fin des colonnes respectives, prêtes à l'emploi immédiatement. Les sommations sont indiquées en gras.
La colonne moyenne est toujours répétée, mais cela en vaut la peine car il est pratique d'avoir la valeur en vue, pour remplir chaque ligne du tableau.
Enfin, l'équation de la quasi-variable donnée au début est appliquée, seules les valeurs sont substituées et comme pour la sommation, nous l'avons déjà calculée:
s c 2 = 1 593 770 / (12-1) = 1 593 770/11 = 144 888,2
C'est la valeur de la quasi-variance et ses unités sont «dollars au carré», ce qui n'a pas beaucoup de sens pratique, donc l'écart quasi-type de l'échantillon est calculé, qui n'est rien de plus que la racine carrée de la quasi-variance:
s c = (√ 144 888,2) $ = 380,64 $
Il est immédiatement confirmé que cette valeur est également obtenue avec la forme alternative de quasi-variance. La somme nécessaire est à la fin de la dernière colonne à gauche:
s c 2 = - = -
= 2,136,016,55 - 1,991,128,36 = 144 888 $ au carré
C'est la même valeur obtenue avec la formule donnée au début.
Solution b
La deuxième valeur de haut en bas est 903, son score standard est
Score standard de 903 = (x - X) / s c = (903-1351) /380,64 = -1,177
Références
- Canavos, G. 1988. Probabilité et statistiques: applications et méthodes. McGraw Hill.
- Devore, J. 2012. Probabilité et statistiques pour l'ingénierie et la science. 8ème. Édition. Cengage.
- Levin, R. 1988. Statistiques pour les administrateurs. 2ème. Édition. Prentice Hall.
- Mesures de dispersion. Récupéré de: thales.cica.es.
- Walpole, R. 2007. Probabilité et statistiques pour l'ingénierie et les sciences. Pearson.