- Types de degrés de liberté
- Dans un boîtier mécanique
- Dans un ensemble de valeurs aléatoires
- Exemples
- Variance et degrés de liberté
- Dans la distribution du chi carré
- Dans le test d'hypothèse (avec exemple résolu)
- Références
Les degrés de liberté en statistique sont le nombre de composantes indépendantes d'un vecteur aléatoire. Si le vecteur a n composantes et qu'il existe p équations linéaires reliant ses composantes, alors le degré de liberté est np.
Le concept de degrés de liberté apparaît également en mécanique théorique, où ils sont à peu près équivalents à la dimension de l'espace où la particule se déplace, moins le nombre de liaisons.
Figure 1. Un pendule se déplace dans deux dimensions, mais il n'a qu'un seul degré de liberté car il est forcé de se déplacer dans un arc de rayon L. Source: F. Zapata.
Cet article abordera le concept de degrés de liberté appliqué aux statistiques, mais un exemple mécanique est plus facile à visualiser sous forme géométrique.
Types de degrés de liberté
Selon le contexte dans lequel il est appliqué, la façon de calculer le nombre de degrés de liberté peut varier, mais l'idée sous-jacente est toujours la même: dimensions totales moins nombre de restrictions.
Dans un boîtier mécanique
Considérons une particule oscillante liée à une corde (un pendule) qui se déplace dans le plan vertical xy (2 dimensions). Cependant, la particule est obligée de se déplacer sur la circonférence du rayon égal à la longueur de la corde.
Comme la particule ne peut se déplacer que sur cette courbe, le nombre de degrés de liberté est de 1. Ceci peut être vu sur la figure 1.
La façon de calculer le nombre de degrés de liberté est de prendre la différence du nombre de dimensions moins le nombre de contraintes:
degrés de liberté: = 2 (dimensions) - 1 (ligature) = 1
Une autre explication qui nous permet d'arriver au résultat est la suivante:
-On sait que la position en deux dimensions est représentée par un point de coordonnées (x, y).
-Mais comme le point doit respecter l'équation de la circonférence (x 2 + y 2 = L 2) pour une valeur donnée de la variable x, la variable y est déterminée par ladite équation ou restriction.
De cette manière, une seule des variables est indépendante et le système a un (1) degré de liberté.
Dans un ensemble de valeurs aléatoires
Pour illustrer ce que signifie le concept, supposons que le vecteur
x = (x 1, x 2,…, x n)
Représentant l'échantillon de n valeurs aléatoires normalement distribuées. Dans ce cas, le vecteur aléatoire x a n composantes indépendantes et on dit donc que x a n degrés de liberté.
Construisons maintenant le vecteur r des résidus
r = (x 1 -
Où
Donc la somme
(x 1 -
C'est une équation qui représente une restriction (ou liaison) dans les éléments du vecteur r des résidus, car si n-1 composants du vecteur r sont connus, l'équation de restriction détermine le composant inconnu.
Donc le vecteur r de dimension n avec la restriction:
∑ (x i -
Il a (n - 1) degrés de liberté.
Encore une fois, il est appliqué que le calcul du nombre de degrés de liberté est:
degrés de liberté: = n (dimensions) - 1 (contraintes) = n-1
Exemples
Variance et degrés de liberté
La variance s 2 est définie comme la moyenne du carré des écarts (ou résidus) de l'échantillon de n données:
s 2 = (r • r) / (n-1)
où r est le vecteur des résidus r = (x1 -
s 2 = ∑ (x i -
Dans tous les cas, il convient de noter que lors du calcul de la moyenne du carré des résidus, elle est divisée par (n-1) et non par n, car comme indiqué dans la section précédente, le nombre de degrés de liberté du vecteur r est (n-1).
Si, pour le calcul de la variance, elle était divisée par n au lieu de (n-1), le résultat aurait un biais hautement significatif pour les valeurs de n inférieures à 50.
Dans la littérature, la formule de variance apparaît également avec le diviseur n au lieu de (n-1), lorsqu'il s'agit de la variance d'une population.
Mais l'ensemble de la variable aléatoire des résidus, représentée par le vecteur r, bien qu'il ait la dimension n, n'a que (n-1) degrés de liberté. Cependant, si le nombre de données est suffisamment grand (n> 500), les deux formules convergent vers le même résultat.
Les calculatrices et les feuilles de calcul fournissent les deux versions de la variance et de l'écart type (qui est la racine carrée de la variance).
Notre recommandation, au vu de l'analyse présentée ici, est de toujours choisir la version avec (n-1) à chaque fois qu'il est nécessaire de calculer la variance ou l'écart type, pour éviter des résultats biaisés.
Dans la distribution du chi carré
Certaines distributions de probabilité en variable aléatoire continue dépendent d'un paramètre appelé degré de liberté, c'est le cas de la distribution du Chi carré (χ 2).
Le nom de ce paramètre provient précisément des degrés de liberté du vecteur aléatoire sous-jacent auquel s'applique cette distribution.
Supposons que nous ayons g populations, à partir desquelles des échantillons de taille n sont prélevés:
X 1 = (x1 1, x1 2,…..x1 n)
X2 = (x2 1, x2 2,…..x2 n)
….
X j = (xj 1, xj 2,…..xj n)
….
Xg = (xg 1, xg 2,…..xg n)
Une population j qui a une moyenne
La variable standardisée ou normalisée zj i est définie comme:
zj i = (xj i -
Et le vecteur Zj est défini comme ceci:
Zj = (zj 1, zj 2,…, zj i,…, zj n) et suit la distribution normale normalisée N (0,1).
Donc la variable:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 +…. + Zg 1 ^ 2),…., (Z1 n ^ 2 + z2 n ^ 2 +…. + Zg n ^ 2))
suit la distribution χ 2 (g) appelée distribution du chi carré avec le degré de liberté g.
Dans le test d'hypothèse (avec exemple résolu)
Lorsque vous souhaitez tester des hypothèses basées sur un certain ensemble de données aléatoires, vous devez connaître le nombre de degrés de liberté g afin d'appliquer le test du chi carré.
Figure 2. Existe-t-il une relation entre la préférence de SAVEUR de crème glacée et le GENRE du client? Source: F. Zapata.
A titre d'exemple, les données collectées sur les préférences de glace au chocolat ou à la fraise chez les hommes et les femmes dans un certain glacier seront analysées. La fréquence à laquelle les hommes et les femmes choisissent la fraise ou le chocolat est résumée à la figure 2.
Tout d'abord, le tableau des fréquences attendues est calculé, qui est préparé en multipliant le total des lignes par le total des colonnes, divisé par le total des données. Le résultat est illustré dans la figure suivante:
Figure 3. Calcul des fréquences attendues en fonction des fréquences observées (valeurs en bleu sur la figure 2). Source: F. Zapata.
Ensuite, le chi carré est calculé (à partir des données) à l'aide de la formule suivante:
χ 2 = ∑ (F o - F e) 2 / F e
Où F o sont les fréquences observées (Figure 2) et F e sont les fréquences attendues (Figure 3). La sommation couvre toutes les lignes et colonnes, ce qui dans notre exemple donne quatre termes.
Après avoir effectué les opérations, vous obtenez:
χ 2 = 0,2043.
Il faut maintenant comparer avec le Chi carré théorique, qui dépend du nombre de degrés de liberté g.
Dans notre cas, ce nombre est déterminé comme suit:
g = (# lignes - 1) (#colonnes - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Il s'avère que le nombre de degrés de liberté g dans cet exemple est de 1.
Si vous souhaitez vérifier ou rejeter l'hypothèse nulle (H0: il n'y a pas de corrélation entre GOÛT et GENRE) avec un niveau de signification de 1%, la valeur théorique du Chi carré est calculée avec le degré de liberté g = 1.
On recherche la valeur qui rend la fréquence accumulée (1 - 0,01) = 0,99, soit 99%. Cette valeur (qui peut être obtenue à partir des tableaux) est de 6 636.
Lorsque le Chi théorique dépasse celui calculé, alors l'hypothèse nulle est vérifiée.
En d'autres termes, avec les données collectées, aucune relation n'est observée entre les variables TASTE et GENDER.
Références
- Minitab. Quels sont les degrés de liberté? Récupéré de: support.minitab.com.
- Moore, David. (2009) Statistiques appliquées de base. Rédacteur d'Antoni Bosch.
- Leigh, Jennifer. Comment calculer les degrés de liberté dans les modèles statistiques. Récupéré de: geniolandia.com
- Wikipédia. Degré de liberté (statistiques). Récupéré de: es.wikipedia.com
- Wikipédia. Degré de liberté (physique). Récupéré de: es.wikipedia.com