Contents
Lorsque nous mesurons la variabilité d’un ensemble de données, il existe deux statistiques étroitement liées à celle-ci : la variance et l’écart-type, qui indiquent toutes deux la dispersion des valeurs des données et impliquent des étapes similaires dans leur calcul. Toutefois, la principale différence entre ces deux analyses statistiques est que l’écart-type est la racine carrée de la variance.
Pour comprendre les différences entre ces deux observations de la dispersion statistique, il faut d’abord comprendre ce que chacune représente : La variance représente tous les points de données d’un ensemble et est calculée en faisant la moyenne de l’écart quadratique de chaque moyenne, tandis que l’écart-type est une mesure de la dispersion autour de la moyenne lorsque la tendance centrale est calculée via la moyenne.
En conséquence, la variance peut être exprimée comme l’écart quadratique moyen des valeurs par rapport à la moyenne ou [squaring deviation of the means] divisé par le nombre d’observations et l’écart type peut être exprimé sous la forme de la racine carrée de la variance.
Construction de l’écart
Pour bien comprendre la différence entre ces statistiques, nous devons comprendre le calcul de la variance. Les étapes du calcul de la variance de l’échantillon sont les suivantes :
- Calculer la moyenne de l’échantillon des données.
- Trouvez la différence entre la moyenne et chacune des valeurs des données.
- Mettez ces différences au carré.
- Additionnez les différences au carré.
- Divisez cette somme par un de moins que le nombre total de valeurs des données.
Les raisons de chacune de ces étapes sont les suivantes :
- La moyenne fournit le point central ou la moyenne des données.
- Les différences par rapport à la moyenne aident à déterminer les écarts par rapport à cette moyenne. Les valeurs des données qui sont éloignées de la moyenne produiront un écart plus important que celles qui sont proches de la moyenne.
- Les différences sont élevées au carré car si les différences sont ajoutées sans être élevées au carré, cette somme sera égale à zéro.
- L’addition de ces écarts au carré donne une mesure de l’écart total.
- La division par un de moins que la taille de l’échantillon fournit une sorte d’écart moyen. Cela annule l’effet de la présence de nombreux points de données qui contribuent chacun à la mesure de la dispersion.
Comme indiqué précédemment, l’écart type est simplement calculé en trouvant la racine carrée de ce résultat, ce qui donne la norme absolue d’écart, indépendamment du nombre total de valeurs des données.
Variance et écart-type
Quand on considère l’écart, on se rend compte qu’il y a un inconvénient majeur à l’utiliser. Lorsque nous suivons les étapes du calcul de la variance, cela montre que la variance est mesurée en termes d’unités carrées car nous avons additionné les différences carrées dans notre calcul. Par exemple, si nos données d’échantillon sont mesurées en termes de mètres, les unités de la variance seront données en mètres carrés.
Afin de normaliser notre mesure de la propagation, nous devons prendre la racine carrée de la variance. Cela éliminera le problème des unités carrées, et nous donnera une mesure de la dispersion qui aura les mêmes unités que notre échantillon initial.
Il existe de nombreuses formules dans les statistiques mathématiques qui ont des formes plus belles lorsque nous les énonçons en termes de variance plutôt que d’écart-type.