Contents
La statistique inférentielle concerne le processus qui consiste à commencer par un échantillon statistique pour arriver ensuite à la valeur d’un paramètre de population inconnu. La valeur inconnue n’est pas déterminée directement. On obtient plutôt une estimation qui se situe dans une fourchette de valeurs. Cette plage est connue en termes mathématiques comme un intervalle de nombres réels et est spécifiquement appelée intervalle de confiance.
Les intervalles de confiance sont tous semblables les uns aux autres à quelques égards. Les intervalles de confiance bilatéraux ont tous la même forme :
Estimation ± marge d’erreur
Les similitudes entre les intervalles de confiance s’étendent également aux étapes utilisées pour calculer les intervalles de confiance. Nous examinerons comment déterminer un intervalle de confiance bilatéral pour une moyenne de population lorsque l’écart-type de la population est inconnu. Une hypothèse sous-jacente est que nous échantillonnons à partir d’une population normalement distribuée.
Processus d’intervalle de confiance pour la moyenne avec un sigma inconnu
Nous travaillerons sur une liste d’étapes nécessaires pour trouver notre intervalle de confiance souhaité. Bien que toutes les étapes soient importantes, la première l’est tout particulièrement :
- Vérifier les conditions: Commencez par vous assurer que les conditions de notre intervalle de confiance sont remplies. Nous partons du principe que la valeur de l’écart type de la population, désigné par la lettre grecque sigma σ, est inconnue et que nous travaillons avec une distribution normale. Nous pouvons assouplir l’hypothèse selon laquelle nous travaillons avec une distribution normale tant que notre échantillon est suffisamment grand et ne présente pas de valeurs aberrantes ou d’asymétrie extrême.
- Calculer l’estimation: Nous estimons notre paramètre de population, dans ce cas, la moyenne de la population, en utilisant une statistique, dans ce cas, la moyenne de l’échantillon. Cela implique la formation d’un échantillon aléatoire simple à partir de notre population. Parfois, nous pouvons supposer que notre échantillon est un échantillon aléatoire simple, même s’il ne répond pas à la définition stricte.
- Valeur critique: Nous obtenons la valeur critique t* qui correspond à notre niveau de confiance. Ces valeurs sont trouvées en consultant un tableau de t-scores ou en utilisant le logiciel. Si nous utilisons un tableau, nous aurons besoin de connaître le nombre de degrés de liberté. Le nombre de degrés de liberté est inférieur de un au nombre d’individus dans notre échantillon.
- Marge d’erreur: Calculer la marge d’erreur t*s /√n, où n est la taille de l’échantillon aléatoire simple que nous avons formé et s est l’écart-type de l’échantillon, que nous obtenons à partir de notre échantillon statistique.
- Conclure: Terminez en rassemblant l’estimation et la marge d’erreur. Celle-ci peut être exprimée soit sous la forme Estimation ± marge d’erreur, soit sous la forme Estimation – marge d’erreur à l’estimation + marge d’erreur. Dans l’énoncé de notre intervalle de confiance, il est important d’indiquer le niveau de confiance. Celui-ci fait tout autant partie de notre intervalle de confiance que les chiffres de l’estimation et de la marge d’erreur.
Exemple
Pour voir comment nous pouvons construire un intervalle de confiance, nous allons travailler à partir d’un exemple. Supposons que nous sachions que les hauteurs d’une espèce spécifique de pois sont normalement réparties. Un échantillon aléatoire simple de 30 pois a une hauteur moyenne de 12 pouces avec un écart-type d’échantillon de 2 pouces. Quel est l’intervalle de confiance à 90% pour la hauteur moyenne de l’ensemble de la population de pois ?
Nous allons suivre les étapes décrites ci-dessus :
- Vérifier les conditions: Les conditions sont réunies puisque l’écart-type de la population est inconnu et que nous avons affaire à une distribution normale.
- Calculer l’estimation: On nous a dit que nous avons un simple échantillon aléatoire de 30 plants de pois. La hauteur moyenne de cet échantillon est de 12 pouces, c’est donc notre estimation.
- Valeur critique: Notre échantillon a une taille de 30, et il y a donc 29 degrés de liberté. La valeur critique pour le niveau de confiance de 90% est donnée par t* = 1,699.
- Marge d’erreur: Nous utilisons maintenant la formule de la marge d’erreur et obtenons une marge d’erreur de t*s /√n = (1,699)(2) /√(30) = 0,620.
- Conclure: Nous concluons en rassemblant tout. Un intervalle de confiance à 90% pour le score moyen de la population en matière de taille est de 12 ± 0,62 pouces. Alternativement, nous pourrions indiquer cet intervalle de confiance comme étant de 11,38 pouces à 12,62 pouces.
Considérations pratiques
Les intervalles de confiance du type ci-dessus sont plus réalistes que les autres types que l’on peut rencontrer dans un cours de statistiques. Il est très rare de connaître l’écart type de la population mais de ne pas connaître la moyenne de la population. Nous supposons ici que nous ne connaissons aucun de ces paramètres de population.