Contents
Selon l’inégalité de Tchebychev, au moins 1-1/K2 des données d’un échantillon doivent se situer dans la fourchette de K écarts types par rapport à la moyenne (ici, K est tout nombre réel positif supérieur à un).
Tout ensemble de données qui est normalement distribué, ou sous la forme d’une courbe en cloche, présente plusieurs caractéristiques. L’une d’entre elles concerne la répartition des données par rapport au nombre d’écarts types par rapport à la moyenne. Dans une distribution normale, nous savons que 68% des données sont à un écart-type de la moyenne, 95% à deux écart-types de la moyenne et environ 99% à trois écart-types près de la moyenne.
Mais si l’ensemble de données n’est pas distribué sous la forme d’une courbe en cloche, une quantité différente pourrait se trouver à l’intérieur d’un écart type. L’inégalité de Tchebychev permet de savoir quelle fraction de données se situe dans les K écarts-types de la moyenne pour tout ensemble de données.
Faits sur l’inégalité
Nous pouvons également affirmer l’inégalité ci-dessus en remplaçant l’expression « données d’un échantillon » par la distribution de probabilité. En effet, l’inégalité de Tchebychev est le résultat d’une probabilité, qui peut ensuite être appliquée aux statistiques.
Il est important de noter que cette inégalité est un résultat qui a été prouvé mathématiquement. Elle n’est pas comme la relation empirique entre la moyenne et le mode, ou la règle empirique qui relie l’intervalle et l’écart type.
Illustration de l’inégalité
Pour illustrer l’inégalité, nous l’examinerons pour quelques valeurs de K :
- Pour K = 2, nous avons 1 – 1/K2 = 1 – 1/4 = 3/4 = 75%. L’inégalité de Tchebychev indique donc qu’au moins 75 % des valeurs des données de toute distribution doivent se situer à deux écarts types près de la moyenne.
- Pour K = 3, nous avons 1 – 1/K2 = 1 – 1/9 = 8/9 = 89%. L’inégalité de Tchebychev indique donc qu’au moins 89% des valeurs des données de toute distribution doivent se situer dans les trois écarts types de la moyenne.
- Pour K = 4, nous avons 1 – 1/K2 = 1 – 1/16 = 15/16 = 93,75%. L’inégalité de Tchebychev indique donc qu’au moins 93,75% des valeurs des données de toute distribution doivent se situer à deux écarts-types près de la moyenne.
Exemple
Supposons que nous ayons prélevé le poids des chiens dans le refuge local et que nous ayons constaté que notre échantillon a une moyenne de 20 livres avec un écart-type de 3 livres. En utilisant l’inégalité de Tchebychev, nous savons qu’au moins 75 % des chiens que nous avons échantillonnés ont un poids qui s’écarte de la moyenne de deux écarts-types. Deux fois l’écart-type nous donne 2 x 3 = 6. Soustrayez et ajoutez ce chiffre à la moyenne de 20. Cela nous indique que 75% des chiens ont un poids compris entre 14 et 26 livres.
Utilisation de l’inégalité
Si nous en savons plus sur la distribution avec laquelle nous travaillons, nous pouvons généralement garantir que plus de données s’éloignent d’un certain nombre d’écarts types de la moyenne. Par exemple, si nous savons que nous avons une distribution normale, alors 95 % des données sont à deux écarts types de la moyenne. L’inégalité de Tchebyshev indique que dans cette situation, nous savons qu’au moins 75% des données s’écartent de la moyenne de deux écarts types. Comme nous pouvons le voir dans ce cas, cela pourrait être beaucoup plus que ces 75 %.
La valeur de l’inégalité est qu’elle nous donne un scénario « pire cas » dans lequel les seules choses que nous savons sur nos données d’échantillon (ou distribution de probabilité) sont la moyenne et l’écart-type. Lorsque nous ne savons rien d’autre sur nos données, l’inégalité de Tchebychev nous donne un aperçu supplémentaire de la répartition de l’ensemble des données.
Histoire de l’inégalité
L’inégalité porte le nom du mathématicien russe Pafnuty Chebyshev, qui a été le premier à déclarer l’inégalité sans preuve en 1874. Dix ans plus tard, l’inégalité a été prouvée par Markov dans sa thèse de doctorat. En raison des différences dans la façon de représenter l’alphabet russe en anglais, Tchebychev s’écrit également Tchebycheff.