Contents
De nombreuses distributions de probabilité sont utilisées dans les statistiques. Par exemple, la distribution normale standard, ou courbe en cloche, est probablement la plus reconnue. Les distributions normales ne sont qu’un type de distribution. Une distribution de probabilités très utile pour étudier les variances de la population est appelée distribution F. Nous allons examiner plusieurs des propriétés de ce type de distribution.
Propriétés de base
La formule de densité de probabilité pour la distribution F est assez compliquée. Dans la pratique, nous n’avons pas besoin de nous préoccuper de cette formule. Il peut cependant être très utile de connaître certains détails des propriétés de la distribution F. Quelques-unes des caractéristiques les plus importantes de cette distribution sont énumérées ci-dessous :
- La distribution F est une famille de distributions. Cela signifie qu’il existe un nombre infini de distributions F différentes. La distribution F particulière que nous utilisons pour une application dépend du nombre de degrés de liberté que possède notre échantillon. Cette caractéristique de la distribution F est similaire à la distribution t et à la distribution chi carré.
- La distribution F est soit nulle soit positive, il n’y a donc pas de valeurs négatives pour F. Cette caractéristique de la distribution F est similaire à la distribution du chi carré.
- La distribution F est biaisée vers la droite. Cette distribution de probabilité est donc non symétrique. Cette caractéristique de la distribution F est similaire à la distribution du chi carré.
Ce sont là quelques-unes des caractéristiques les plus importantes et les plus facilement identifiables. Nous allons examiner de plus près les degrés de liberté.
Degrés de liberté
Une caractéristique commune aux distributions chi-carré, t-distributions et F-distributions est qu’il existe en réalité une famille infinie de chacune de ces distributions. Une distribution particulière est identifiée en connaissant le nombre de degrés de liberté. Pour une distribution t, le nombre de degrés de liberté est inférieur d’un degré à la taille de notre échantillon. Le nombre de degrés de liberté pour une distribution F est déterminé d’une manière différente que pour une distribution t ou même une distribution chi carré.
Nous verrons ci-dessous comment se produit exactement une distribution F. Pour l’instant, nous n’en considérerons que suffisamment pour déterminer le nombre de degrés de liberté. La distribution F est dérivée d’un ratio impliquant deux populations. Il y a un échantillon de chacune de ces populations et il y a donc des degrés de liberté pour ces deux échantillons. En fait, nous en soustrayons un de la taille des deux échantillons pour déterminer nos deux nombres de degrés de liberté.
Les statistiques de ces populations se combinent en une fraction pour la statistique F. Le numérateur et le dénominateur ont tous deux des degrés de liberté. Plutôt que de combiner ces deux nombres en un autre nombre, nous les conservons tous les deux. Par conséquent, toute utilisation d’un tableau de distribution F nous oblige à rechercher deux degrés de liberté différents.
Utilisations de la distribution F
La distribution F découle de statistiques inférentielles concernant les variations de population. Plus précisément, nous utilisons une distribution F lorsque nous étudions le rapport des variances de deux populations normalement distribuées.
La distribution F n’est pas uniquement utilisée pour construire des intervalles de confiance et tester des hypothèses sur les variances de la population. Ce type de distribution est également utilisé dans une analyse de variance à un facteur (ANOVA). L’ANOVA vise à comparer la variation entre plusieurs groupes et la variation au sein de chaque groupe. Pour ce faire, nous utilisons un ratio de variances. Ce rapport de variance a la distribution F. Une formule un peu compliquée nous permet de calculer une statistique F comme statistique test.