Contents
En statistique, les degrés de liberté sont utilisés pour définir le nombre de quantités indépendantes qui peuvent être attribuées à une distribution statistique. Ce nombre se réfère généralement à un nombre entier positif qui indique l’absence de restrictions sur la capacité d’une personne à calculer les facteurs manquants des problèmes statistiques.
Les degrés de liberté agissent comme des variables dans le calcul final d’une statistique et sont utilisés pour déterminer le résultat de différents scénarios dans un système. En mathématiques, les degrés de liberté définissent le nombre de dimensions dans un domaine qui est nécessaire pour déterminer le vecteur complet.
Pour illustrer le concept de degré de liberté, nous allons examiner un calcul de base concernant la moyenne de l’échantillon, et pour trouver la moyenne d’une liste de données, nous additionnons toutes les données et divisons par le nombre total de valeurs.
Une illustration avec un exemple de moyenne
Supposons un instant que nous savons que la moyenne d’un ensemble de données est de 25 et que les valeurs de cet ensemble sont 20, 10, 50 et un nombre inconnu. La formule de la moyenne d’un échantillon nous donne l’équation (20 + 10 + 50 + x)/4 = 25, où x désigne l’inconnu. En utilisant un peu d’algèbre de base, on peut alors déterminer que le nombre manquant, x, est égal à 20.
Modifions légèrement ce scénario. Là encore, nous supposons que nous savons que la moyenne d’un ensemble de données est de 25. Cependant, cette fois, les valeurs de l’ensemble de données sont 20, 10 et deux valeurs inconnues. Ces inconnues pourraient être différentes, c’est pourquoi nous utilisons deux variables différentes, x et y, pour indiquer cela. L’équation qui en résulte est (20 + 10 + x + y)/4 = 25. Avec un peu d’algèbre, nous obtenons y = 70- x. La formule est écrite sous cette forme pour montrer qu’une fois que nous avons choisi une valeur pour x, la valeur pour y est complètement déterminée. Nous avons un choix à faire, et cela montre qu’il y a un degré de liberté.
Nous allons maintenant nous pencher sur un échantillon de cent personnes. Si nous savons que la moyenne de cet échantillon est de 20, mais que nous ne connaissons la valeur d’aucune des données, alors il y a 99 degrés de liberté. Toutes les valeurs doivent s’additionner pour donner un total de 20 x 100 = 2000. Une fois que nous avons les valeurs de 99 éléments dans l’ensemble de données, alors le dernier a été déterminé.
T-score des étudiants et distribution du chi carré
Les degrés de liberté jouent un rôle important dans l’utilisation du tableau des t-score des étudiants. Il existe en fait plusieurs distributions de t-score. Nous différencions ces distributions par l’utilisation des degrés de liberté.
Ici, la distribution de probabilité que nous utilisons dépend de la taille de notre échantillon. Si la taille de notre échantillon est n, alors le nombre de degrés de liberté est n-1. Par exemple, pour un échantillon de 22 personnes, nous devons utiliser la ligne du tableau des scores t avec 21 degrés de liberté.
L’utilisation d’une distribution chi carré nécessite également l’utilisation de degrés de liberté. Ici, de la même manière que pour la distribution des t-score, la taille de l’échantillon détermine la distribution à utiliser. Si la taille de l’échantillon est n, alors il y a n-1 degrés de liberté.
Écart-type et techniques avancées
Un autre endroit où les degrés de liberté apparaissent est dans la formule de l’écart type. Cette occurrence n’est pas aussi évidente, mais nous pouvons la voir si nous savons où chercher. Pour trouver un écart-type, nous cherchons l’écart « moyen » par rapport à la moyenne. Cependant, après avoir soustrait la moyenne de chaque valeur de données et avoir élevé au carré les différences, nous finissons par diviser par n-1 plutôt que par n comme on pourrait s’y attendre.
La présence du n-1 vient du nombre de degrés de liberté. Comme les n valeurs des données et la moyenne de l’échantillon sont utilisées dans la formule, il y a n-1 degrés de liberté.
Des techniques statistiques plus avancées utilisent des moyens plus compliqués pour compter les degrés de liberté. Lorsque l’on calcule la statistique de test pour deux moyennes avec des échantillons indépendants d’éléments n1 et n2, le nombre de degrés de liberté a une formule assez compliquée. Il peut être estimé en utilisant le plus petit des deux nombres suivants : n1-1 et n2-1
Un autre exemple d’une façon différente de compter les degrés de liberté est le test F. Dans ce test, nous avons k échantillons de taille n – les degrés de liberté au numérateur sont k-1 et au dénominateur k(n-1).