Règle empirique pour la moyenne, la médiane et le mode

Contents

Dans les ensembles de données, il existe une variété de statistiques descriptives. La moyenne, la médiane et le mode donnent tous des mesures du centre des données, mais ils le calculent de différentes manières :

  • La moyenne est calculée en additionnant toutes les valeurs des données, puis en divisant par le nombre total de valeurs.
  • La médiane est calculée en listant les valeurs des données par ordre croissant, puis en trouvant la valeur du milieu dans la liste.
  • Le mode est calculé en comptant le nombre de fois que chaque valeur se produit. La valeur qui se produit avec la fréquence la plus élevée est le mode.

A première vue, il semblerait qu’il n’y ait aucun lien entre ces trois numéros. Cependant, il s’avère qu’il existe une relation empirique entre ces mesures du centre.

Théorique ou empirique

Avant de poursuivre, il est important de comprendre ce dont nous parlons lorsque nous nous référons à une relation empirique et que nous la comparons à des études théoriques. Certains résultats en matière de statistiques et dans d’autres domaines de connaissance peuvent être dérivés de certaines déclarations précédentes de manière théorique. Nous commençons par ce que nous savons, puis nous utilisons la logique, les mathématiques et le raisonnement déductif et voyons où cela nous mène. Le résultat est une conséquence directe d’autres faits connus.

La manière empirique d’acquérir des connaissances contraste avec la théorie. Plutôt que de raisonner à partir de principes déjà établis, nous pouvons observer le monde qui nous entoure. À partir de ces observations, nous pouvons alors formuler une explication de ce que nous avons vu. Une grande partie de la science se fait de cette manière. Les expériences nous fournissent des données empiriques. L’objectif est alors de formuler une explication qui correspond à toutes les données.

A lire :  Erreurs de type I et de type II dans les tests d'hypothèse

Relation empirique

En statistique, il existe une relation entre la moyenne, la médiane et le mode qui repose sur une base empirique. L’observation d’innombrables ensembles de données a montré que la plupart du temps, la différence entre la moyenne et le mode est trois fois supérieure à la différence entre la moyenne et la médiane. Cette relation sous forme d’équation est :

Moyenne – Mode = 3(Moyenne – Médiane).

Exemple

Pour voir la relation ci-dessus avec les données du monde réel, examinons les populations des États américains en 2010. En millions, les populations étaient : Californie – 36,4, Texas – 23,5, New York – 19,3, Floride – 18,1, Illinois – 12,8, Pennsylvanie – 12,4, Ohio – 11,5, Michigan – 10,1, Géorgie – 9,4, Caroline du Nord – 8,9, New Jersey – 8,7, Virginie – 7.6, Massachusetts – 6,4, Washington – 6,4, Indiana – 6,3, Arizona – 6,2, Tennessee – 6,0, Missouri – 5,8, Maryland – 5,6, Wisconsin – 5,6, Minnesota – 5,2, Colorado – 4,8, Alabama – 4,6, Caroline du Sud – 4.3, Louisiane – 4,3, Kentucky – 4,2, Oregon – 3,7, Oklahoma – 3,6, Connecticut – 3,5, Iowa – 3,0, Mississippi – 2,9, Arkansas – 2,8, Kansas – 2,8, Utah – 2,6, Nevada – 2,5, Nouveau Mexique – 2,0, Virginie occidentale – 1.8, Nebraska – 1,8, Idaho – 1,5, Maine – 1,3, New Hampshire – 1,3, Hawaii – 1,3, Rhode Island – 1,1, Montana – 0,9, Delaware – 0,9, Dakota du Sud – 0,8, Alaska – 0,7, Dakota du Nord – 0,6, Vermont – 0,6, Wyoming – 0,5

La population moyenne est de 6,0 millions d’habitants. La population médiane est de 4,25 millions d’habitants. Le mode est de 1,3 million. Nous allons maintenant calculer les différences par rapport à ce qui précède :

  • Moyenne – Mode = 6,0 millions – 1,3 million = 4,7 millions.
  • 3(Moyenne – Médiane) = 3(6,0 millions – 4,25 millions) = 3(1,75 millions) = 5,25 millions.
A lire :  Que sont les résidus ?

Bien que ces deux chiffres ne correspondent pas exactement, ils sont relativement proches l’un de l’autre.

Candidature

Il y a quelques demandes pour la formule ci-dessus. Supposons que nous n’ayons pas de liste de valeurs de données, mais que nous connaissions deux valeurs parmi la moyenne, la médiane ou le mode. La formule ci-dessus pourrait être utilisée pour estimer la troisième quantité inconnue.

Par exemple, si nous savons que nous avons une moyenne de 10, un mode de 4, quelle est la médiane de notre ensemble de données ? Puisque Moyenne – Mode = 3(Moyenne – Médiane), nous pouvons dire que 10 – 4 = 3(10 – Médiane). Par une certaine algèbre, nous voyons que 2 = (10 – Médiane), et donc la médiane de nos données est 8.

Une autre application de la formule ci-dessus est le calcul de l’asymétrie. Puisque l’asymétrie mesure la différence entre la moyenne et le mode, nous pourrions plutôt calculer 3(Moyenne – Mode). Pour rendre cette quantité sans dimension, nous pouvons la diviser par l’écart-type afin de donner un autre moyen de calculer l’asymétrie que l’utilisation des moments en statistique.

Un mot de prudence

Comme on l’a vu plus haut, ce qui précède n’est pas une relation exacte. Il s’agit plutôt d’une bonne règle empirique, similaire à celle de la règle de la fourchette, qui établit un lien approximatif entre l’écart-type et la fourchette. La moyenne, la médiane et le mode peuvent ne pas correspondre exactement à la relation empirique ci-dessus, mais il y a de bonnes chances qu’elle soit raisonnablement proche.

Bouton retour en haut de la page

Adblock détecté

Veuillez désactiver votre bloqueur de publicités pour pouvoir visualiser le contenu de la page. Pour un site indépendant avec du contenu gratuit, c’est une question de vie ou de mort d’avoir de la publicité. Merci de votre compréhension!