L'éventail des ensembles de données statistiques

Contents

En statistique et en mathématiques, la fourchette est la différence entre les valeurs maximales et minimales d’un ensemble de données et constitue l’une des deux caractéristiques importantes d’un ensemble de données. La formule d’une fourchette est la valeur maximale moins la valeur minimale de l’ensemble de données, ce qui permet aux statisticiens de mieux comprendre à quel point l’ensemble de données est varié.

Deux caractéristiques importantes d’un ensemble de données sont le centre des données et la dispersion des données, et le centre peut être mesuré de plusieurs façons : les plus populaires sont la moyenne, la médiane, le mode et la fourchette moyenne, mais de la même manière, il existe différentes façons de calculer la dispersion de l’ensemble de données et la mesure la plus simple et la plus grossière de la dispersion est appelée la fourchette.

Le calcul de la fourchette est très simple. Il suffit de trouver la différence entre la plus grande valeur de données de notre ensemble et la plus petite. En résumé, nous avons la formule suivante : Fourchette = Valeur maximale – Valeur minimale. Par exemple, l’ensemble de données 4,6,10, 15, 18 a un maximum de 18, un minimum de 4 et une plage de 18-4 = 14.

Limites de la gamme

La fourchette est une mesure très grossière de la dispersion des données car elle est extrêmement sensible aux valeurs aberrantes. Par conséquent, l’utilité d’une véritable fourchette d’un ensemble de données pour les statisticiens est limitée car une seule valeur de données peut grandement affecter la valeur de la fourchette.

A lire : Une introduction à la théorie des files d'attente

Prenons par exemple l’ensemble des données 1, 2, 3, 4, 6, 7, 7, 8. La valeur maximale est 8, la minimale est 1 et la plage est 7. Ensuite, considérez le même ensemble de données, mais avec la valeur 100 incluse. L’intervalle devient alors 100-1 = 99, l’ajout d’un seul point de données supplémentaire affectant grandement la valeur de l’intervalle. L’écart-type est une autre mesure de l’écart qui est moins sensible aux valeurs aberrantes, mais l’inconvénient est que le calcul de l’écart-type est beaucoup plus compliqué.

La gamme ne nous dit rien non plus sur les caractéristiques internes de notre ensemble de données. Par exemple, nous considérons l’ensemble de données 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 où la plage pour cet ensemble de données est de 10-1 = 9. Si nous comparons ensuite cet ensemble de données à l’ensemble de données 1, 1, 1, 2, 9, 9, 9, 10, la plage est encore une fois de neuf, mais contrairement au premier ensemble, les données sont regroupées autour du minimum et du maximum. D’autres statistiques, telles que le premier et le troisième quartile, devraient être utilisées pour détecter une partie de cette structure interne.

Applications de la gamme

L’intervalle est un bon moyen de comprendre très simplement la répartition réelle des nombres dans l’ensemble de données, car il est facile à calculer puisqu’il ne nécessite qu’une opération arithmétique de base, mais il existe également quelques autres applications de l’intervalle d’un ensemble de données dans le domaine des statistiques.

La fourchette peut également être utilisée pour estimer une autre mesure de la propagation, l’écart-type. Plutôt que de passer par une formule assez compliquée pour trouver l’écart type, nous pouvons utiliser ce que l’on appelle la règle de la fourchette. La fourchette est fondamentale dans ce calcul.

A lire : Comment et quand utiliser la distribution uniforme

L’aire de répartition se trouve également dans un boxplot, ou une boîte et des moustaches. Les valeurs maximales et minimales sont toutes deux représentées par un graphique à la fin des moustaches du graphique et la longueur totale des moustaches et de la boîte est égale à la fourchette.

Limites de la gamme

Applications de la gamme

Articles similaires

Adblock détecté