Échantillonnage avec ou sans remplacement

Contents

L’échantillonnage statistique peut être réalisé de différentes manières. Outre le type de méthode d’échantillonnage que nous utilisons, il y a une autre question relative à ce qui arrive spécifiquement à un individu que nous avons choisi au hasard. Cette question qui se pose lors de l’échantillonnage est la suivante : « Après avoir sélectionné un individu et enregistré la mesure de l’attribut que nous étudions, que faisons-nous de cet individu ?

Il y a deux options :

  • Nous pouvons replacer l’individu dans le bassin où nous prélevons des échantillons.
  • Nous pouvons choisir de ne pas remplacer l’individu.

On peut très facilement voir que cela conduit à deux situations différentes. Dans la première, le remplacement laisse ouverte la possibilité que l’individu soit choisi au hasard une seconde fois. Pour la seconde option, si nous travaillons sans remplacement, il est alors impossible de choisir deux fois la même personne. Nous verrons que cette différence affectera le calcul des probabilités liées à ces échantillons.

Effet sur les probabilités

Pour voir comment la façon dont nous traitons le remplacement affecte le calcul des probabilités, examinez l’exemple de question suivant. Quelle est la probabilité de tirer deux as d’un jeu de cartes standard ?

Cette question est ambiguë. Que se passe-t-il une fois que nous avons tiré la première carte ? La remet-on dans le paquet ou la laisse-t-on en dehors ?

Nous commençons par calculer la probabilité avec remplacement. Il y a quatre as et 52 cartes au total, donc la probabilité de tirer un as est de 4/52. Si nous remplaçons cette carte et que nous tirons à nouveau, la probabilité est de nouveau de 4/52. Ces événements étant indépendants, nous multiplions les probabilités (4/52) x (4/52) = 1/169, soit environ 0,592 %.

A lire :  Calcul de la moyenne, de la médiane et du mode

Nous allons maintenant comparer cette situation à la même, à l’exception du fait que nous ne remplaçons pas les cartes. La probabilité de tirer un as lors du premier tirage est toujours de 4/52. Pour la deuxième carte, nous supposons qu’un as a déjà été tiré. Nous devons maintenant calculer une probabilité conditionnelle. En d’autres termes, nous devons savoir quelle est la probabilité de tirer un deuxième as, étant donné que la première carte est également un as.

Il reste maintenant trois as sur un total de 51 cartes. La probabilité conditionnelle d’un deuxième as après avoir tiré un as est donc de 3/51. La probabilité de tirer deux as sans remplacement est de (4/52) x (3/51) = 1/221, soit environ 0,425 %.

Nous voyons directement dans le problème ci-dessus que ce que nous choisissons de faire avec le remplacement a une incidence sur les valeurs des probabilités. Il peut modifier ces valeurs de manière significative.

Taille de la population

Il existe certaines situations où l’échantillonnage avec ou sans remplacement ne modifie pas sensiblement les probabilités. Supposons que nous choisissions au hasard deux personnes dans une ville de 50 000 habitants, dont 30 000 sont des femmes.

Si nous échantillonnons avec remplacement, alors la probabilité de choisir une femme lors de la première sélection est donnée par 30000/50000 = 60%. La probabilité de choisir une femme lors de la deuxième sélection est toujours de 60 %. La probabilité que les deux personnes soient des femmes est de 0,6 x 0,6 = 0,36.

Si nous prélevons sans remplacement, la première probabilité n’est pas affectée. La deuxième probabilité est maintenant de 29999/49999 = 0,5999919998…, ce qui est extrêmement proche de 60%. La probabilité que les deux soient des femmes est de 0,6 x 0,5999919998 = 0,359995.

A lire :  L'importance du théorème de la limite centrale

Les probabilités sont techniquement différentes, mais elles sont suffisamment proches pour être presque impossibles à distinguer. C’est pourquoi, bien souvent, même si nous prélevons un échantillon sans remplacement, nous traitons la sélection de chaque individu comme s’il était indépendant des autres individus de l’échantillon.

Autres demandes

Il existe d’autres cas où nous devons nous demander s’il faut prélever un échantillon avec ou sans remplacement. C’est le cas par exemple du bootstrapping. Cette technique statistique s’inscrit dans le cadre d’une technique de rééchantillonnage.

Dans le bootstrapping, nous commençons par un échantillon statistique d’une population. Nous utilisons ensuite un logiciel informatique pour calculer les échantillons bootstrap. En d’autres termes, l’ordinateur rééchantillonne avec remplacement de l’échantillon initial.

Bouton retour en haut de la page

Adblock détecté

Veuillez désactiver votre bloqueur de publicités pour pouvoir visualiser le contenu de la page. Pour un site indépendant avec du contenu gratuit, c’est une question de vie ou de mort d’avoir de la publicité. Merci de votre compréhension!