Quelle est l’approximation normale de la distribution binomiale ?

Contents

Les variables aléatoires avec une distribution binomiale sont connues pour être discrètes. Cela signifie qu’il y a un nombre dénombrable de résultats qui peuvent se produire dans une distribution binomiale, avec une séparation entre ces résultats. Par exemple, une variable binomiale peut prendre une valeur de trois ou quatre, mais pas un nombre compris entre trois et quatre.

Avec le caractère discret d’une distribution binomiale, il est quelque peu surprenant qu’une variable aléatoire continue puisse être utilisée pour se rapprocher d’une distribution binomiale. Pour de nombreuses distributions binomiales, nous pouvons utiliser une distribution normale pour approximer nos probabilités binomiales.

C’est ce que l’on peut constater en regardant n coups de pièces de monnaie et en laissant X être le nombre de têtes. Dans cette situation, nous avons une distribution binomiale avec une probabilité de succès de p = 0,5. Plus le nombre de lancers augmente, plus l’histogramme des probabilités ressemble à une distribution normale.

Déclaration de l’approximation normale

Toute distribution normale est entièrement définie par deux nombres réels. Ces nombres sont la moyenne, qui mesure le centre de la distribution, et l’écart-type, qui mesure l’étendue de la distribution. Pour une situation binomiale donnée, nous devons pouvoir déterminer la distribution normale à utiliser.

La sélection de la distribution normale correcte est déterminée par le nombre d’essais n dans le cadre binomial et la probabilité constante de succès p pour chacun de ces essais. L’approximation normale pour notre variable binomiale est une moyenne de np et un écart-type de (np(1 – p)0,5.

Par exemple, supposons que nous devinions sur chacune des 100 questions d’un test à choix multiples, où chaque question a une réponse correcte sur quatre choix. Le nombre de réponses correctes X est une variable aléatoire binomiale avec n = 100 et p = 0,25. Cette variable aléatoire a donc une moyenne de 100(0,25) = 25 et un écart-type de (100(0,25)(0,75))0,5 = 4,33. Une distribution normale avec une moyenne de 25 et un écart-type de 4,33 permettra de se rapprocher de cette distribution binomiale.

A lire :  Déterminer les valeurs aberrantes dans les statistiques

Quand le rapprochement est-il approprié ?

En utilisant quelques mathématiques, on peut montrer qu’il y a quelques conditions pour lesquelles nous devons utiliser une approximation normale de la distribution binomiale. Le nombre d’observations n doit être suffisamment grand, et la valeur de p doit être telle que np et n(1 – p) soient tous deux supérieurs ou égaux à 10. Il s’agit d’une règle empirique, qui est guidée par la pratique statistique. L’approximation normale peut toujours être utilisée, mais si ces conditions ne sont pas remplies, alors l’approximation peut ne pas être aussi bonne qu’une approximation.

Par exemple, si n = 100 et p = 0,25, nous sommes justifiés d’utiliser l’approximation normale. Cela est dû au fait que np = 25 et n(1 – p) = 75. Comme ces deux nombres sont supérieurs à 10, la distribution normale appropriée fera un assez bon travail d’estimation des probabilités binomiales.

Pourquoi utiliser l’approximation ?

Les probabilités binomiales sont calculées en utilisant une formule très simple pour trouver le coefficient binomial. Malheureusement, en raison des factoriels de la formule, il peut être très facile de rencontrer des difficultés de calcul avec la formule binomiale. L’approximation normale nous permet de contourner l’un de ces problèmes en travaillant avec un ami familier, un tableau de valeurs d’une distribution normale standard.

La détermination de la probabilité qu’une variable aléatoire binomiale se situe dans une plage de valeurs est souvent fastidieuse à calculer. En effet, pour trouver la probabilité qu’une variable binomiale X soit supérieure à 3 et inférieure à 10, il faudrait trouver la probabilité que X soit égal à 4, 5, 6, 7, 8 et 9, puis additionner toutes ces probabilités. Si l’approximation normale peut être utilisée, nous devrons plutôt déterminer les z-scores correspondant à 3 et 10, puis utiliser un tableau des probabilités de z-scores pour la distribution normale standard.

Bouton retour en haut de la page

Adblock détecté

Veuillez désactiver votre bloqueur de publicités pour pouvoir visualiser le contenu de la page. Pour un site indépendant avec du contenu gratuit, c’est une question de vie ou de mort d’avoir de la publicité. Merci de votre compréhension!