- Données groupées
- Exemple
- Les 3 principales mesures de la tendance centrale
- 1- Moyenne arithmétique
- 2- Moyen
- 3- Mode
- Références
Les mesures de tendance centrale des données groupées sont utilisées dans les statistiques pour décrire certains comportements d'un groupe de données fournies, telles que la valeur dont elles se rapprochent, la moyenne des données collectées, entre autres.
Lorsqu'on prend une grande quantité de données, il est utile de les regrouper pour en avoir un meilleur ordre et ainsi pouvoir calculer certaines mesures de tendance centrale.
La moyenne arithmétique, la médiane et le mode figurent parmi les mesures de tendance centrale les plus utilisées. Ces chiffres révèlent certaines qualités des données collectées dans une certaine expérience.
Pour utiliser ces mesures, vous devez d'abord savoir comment grouper un ensemble de données.
Données groupées
Pour regrouper des données, vous devez d'abord calculer la plage des données, qui est obtenue en soustrayant la plus grande valeur moins la plus petite valeur des données.
Ensuite, un nombre "k" est choisi, qui est le nombre de classes dans lesquelles nous voulons regrouper les données.
La plage est divisée par "k" pour obtenir l'amplitude des classes à grouper. Ce nombre est C = R / k.
Enfin, le regroupement commence, pour lequel un nombre inférieur à la valeur la plus basse des données obtenues est choisi.
Ce nombre sera la limite inférieure de la première classe. A cela s'ajoute C. La valeur obtenue sera la limite supérieure de la première classe.
Ensuite, C est ajouté à cette valeur et la limite supérieure de la deuxième classe est obtenue. De cette façon, nous procédons à l'obtention de la limite supérieure de la dernière classe.
Une fois les données regroupées, la moyenne, la médiane et le mode peuvent être calculés.
Pour illustrer comment la moyenne arithmétique, la médiane et le mode sont calculés, nous allons procéder avec un exemple.
Exemple
Par conséquent, lors du regroupement des données, un tableau comme le suivant sera obtenu:
Les 3 principales mesures de la tendance centrale
Nous allons maintenant procéder au calcul de la moyenne arithmétique, de la médiane et du mode. L'exemple ci-dessus sera utilisé pour illustrer cette procédure.
1- Moyenne arithmétique
La moyenne arithmétique consiste à multiplier chaque fréquence par la moyenne de l'intervalle. Ensuite, tous ces résultats sont ajoutés et finalement divisés par le total des données.
En utilisant l'exemple précédent, on obtiendrait que la moyenne arithmétique soit égale à:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5.11111
Cela indique que la valeur moyenne des données du tableau est 5.11111.
2- Moyen
Pour calculer la médiane d'un ensemble de données, nous classons d'abord toutes les données du plus petit au plus grand. Deux cas peuvent survenir:
- Si le nombre de données est impair, alors la médiane correspond aux données qui se trouvent au centre.
- Si le nombre de données est pair, alors la médiane est la moyenne des deux données qui se trouvent au centre.
En ce qui concerne les données groupées, le calcul de la médiane se fait comme suit:
- N / 2 est calculé, où N est le total des données.
- Le premier intervalle est recherché où la fréquence accumulée (la somme des fréquences) est supérieure à N / 2, et la limite inférieure de cet intervalle est sélectionnée, appelée Li.
La médiane est donnée par la formule suivante:
Me = Li + (Ls-Li) * (N / 2 - Fréquence accumulée avant Li) / fréquence de [Li, Ls)
Ls est la limite supérieure de l'intervalle mentionné ci-dessus.
Si le tableau de données précédent est utilisé, N / 2 = 18/2 = 9. Les fréquences cumulées sont 4, 8, 14 et 18 (une pour chaque ligne du tableau).
Par conséquent, le troisième intervalle doit être sélectionné, car la fréquence cumulée est supérieure à N / 2 = 9.
Donc Li = 5 et Ls = 7. En appliquant la formule décrite ci-dessus, vous devez:
Moi = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Mode
Le mode est la valeur qui a la fréquence la plus élevée parmi toutes les données groupées; c'est-à-dire que c'est la valeur qui est répétée le plus souvent dans l'ensemble de données initial.
Lorsque vous avez une très grande quantité de données, la formule suivante est utilisée pour calculer le mode des données groupées:
Mo = Li + (Ls-Li) * (fréquence de Li - Fréquence de L (i-1)) / ((fréquence de Li - Fréquence de L (i-1)) + (fréquence de Li - Fréquence de L (i + 1)))
L'intervalle [Li, Ls) est l'intervalle où se trouve la fréquence la plus élevée. Pour l'exemple réalisé dans cet article, le mode est donné par:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Une autre formule utilisée pour obtenir une valeur approximative du mode est la suivante:
Mo = Li + (Ls-Li) * (fréquence L (i + 1)) / (fréquence L (i-1) + fréquence L (i + 1)).
Avec cette formule, les comptes sont les suivants:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Références
- Bellhouse, DR (2011). Abraham De Moivre: Préparer le terrain pour la probabilité classique et ses applications. CRC Press.
- Cifuentes, JF (2002). Introduction à la théorie des probabilités. Université nationale de Colombie.
- Daston, L. (1995). Probabilité classique au siècle des Lumières. Presses universitaires de Princeton.
- Larson, HJ (1978). Introduction à la théorie des probabilités et à l'inférence statistique. Éditorial Limusa.
- Martel, PJ et Vegas, FJ (1996). Probabilités et statistiques mathématiques: applications en pratique clinique et gestion de la santé. Éditions Díaz de Santos.
- Vázquez, AL et Ortiz, FJ (2005). Méthodes statistiques pour mesurer, décrire et contrôler la variabilité. Ed. Université de Cantabrie.
- Vázquez, SG (2009). Manuel de mathématiques pour l'accès à l'université. Éditorial Centro de Estudios Ramon Areces SA.