Contents
Le minimum est la plus petite valeur de l’ensemble des données. Le maximum est la valeur la plus élevée de l’ensemble de données. Découvrez comment ces statistiques peuvent ne pas être aussi insignifiantes.
Contexte
Un ensemble de données quantitatives présente de nombreuses caractéristiques. L’un des objectifs des statistiques est de décrire ces caractéristiques avec des valeurs significatives et de fournir un résumé des données sans énumérer toutes les valeurs de l’ensemble de données. Certaines de ces statistiques sont assez élémentaires et semblent presque insignifiantes. Le maximum et le minimum fournissent de bons exemples du type de statistique descriptive qu’il est facile de marginaliser. Bien que ces deux chiffres soient extrêmement faciles à déterminer, ils apparaissent dans le calcul d’autres statistiques descriptives. Comme nous l’avons vu, les définitions de ces deux statistiques sont très intuitives.
Le minimum
Nous commençons par examiner de plus près les statistiques dites minimales. Ce nombre est la valeur de la donnée qui est inférieure ou égale à toutes les autres valeurs de notre ensemble de données. Si nous devions classer toutes nos données par ordre croissant, le minimum serait alors le premier chiffre de notre liste. Bien que la valeur minimale puisse être répétée dans notre ensemble de données, il s’agit par définition d’un nombre unique. Il ne peut y avoir deux minima, car l’une de ces valeurs doit être inférieure à l’autre.
Le maximum
Maintenant, nous nous tournons vers le maximum. Ce nombre est la valeur de la donnée qui est supérieure ou égale à toutes les autres valeurs de notre ensemble de données. Si nous devions classer toutes nos données par ordre croissant, le maximum serait alors le dernier chiffre indiqué. Le maximum est un nombre unique pour un ensemble de données donné. Ce nombre peut être répété, mais il n’y a qu’un seul maximum pour un ensemble de données. Il ne peut y avoir deux maxima car l’une de ces valeurs serait supérieure à l’autre.
Exemple
Voici un exemple d’ensemble de données :
23, 2, 4, 10, 19, 15, 21, 41, 3, 24, 1, 20, 19, 15, 22, 11, 4
Nous ordonnons les valeurs par ordre croissant et nous voyons que 1 est la plus petite de celles de la liste. Cela signifie que 1 est le minimum de l’ensemble de données. Nous voyons également que 41 est plus grand que toutes les autres valeurs de la liste. Cela signifie que 41 est le maximum de l’ensemble de données.
Utilisations du maximum et du minimum
En plus de nous donner des informations très élémentaires sur un ensemble de données, le maximum et le minimum apparaissent dans les calculs pour d’autres statistiques sommaires.
Ces deux chiffres sont utilisés pour calculer la fourchette, qui est simplement la différence entre le maximum et le minimum.
Le maximum et le minimum font également leur apparition aux côtés des premier, deuxième et troisième quartiles dans la composition des valeurs composant le résumé à cinq chiffres d’un ensemble de données. Le minimum est le premier nombre énuméré car il est le plus bas, et le maximum est le dernier nombre énuméré car il est le plus élevé. En raison de ce lien avec le résumé à cinq chiffres, le maximum et le minimum apparaissent tous deux sur un diagramme en boîtes et en moustaches.
Limites du maximum et du minimum
Le maximum et le minimum sont très sensibles aux valeurs aberrantes. La raison en est simple : si une valeur est ajoutée à un ensemble de données qui est inférieure au minimum, alors le minimum change et c’est cette nouvelle valeur. De la même manière, si une valeur supérieure au maximum est incluse dans un ensemble de données, le maximum changera.
Par exemple, supposons que la valeur de 100 soit ajoutée à l’ensemble de données que nous avons examiné ci-dessus. Cela affecterait le maximum, et il passerait de 41 à 100.
Souvent, le maximum ou le minimum sont des valeurs aberrantes de notre ensemble de données. Pour déterminer s’il s’agit effectivement de valeurs aberrantes, nous pouvons utiliser la règle de l’intervalle interquartile.