Campionamento con o senza sostituzione

click fraud protection

Campionamento statistico può essere fatto in diversi modi. Oltre al tipo di metodo di campionamento che utilizziamo, c'è un'altra domanda relativa a ciò che accade specificamente a un individuo che abbiamo selezionato in modo casuale. Questa domanda che sorge quando il campionamento è: "Dopo aver selezionato un individuo e registrato la misurazione dell'attributo che stiamo studiando, cosa facciamo con l'individuo?"

Esistono due opzioni:

  • Possiamo rimpiazzare l'individuo nel pool da cui stiamo campionando.
  • Possiamo scegliere di non sostituire l'individuo.

Possiamo facilmente vedere che questi portano a due diverse situazioni. Nella prima opzione, la sostituzione lascia aperta la possibilità che l'individuo venga scelto casualmente una seconda volta. Per la seconda opzione, se stiamo lavorando senza sostituzione, è impossibile scegliere la stessa persona due volte. Vedremo che questa differenza influenzerà il calcolo delle probabilità relative a questi campioni.

Effetto sulle probabilità

Per vedere come gestiamo la sostituzione influisce sul calcolo delle probabilità, considerare la seguente domanda di esempio. Qual è la probabilità di trarre due assi da a

instagram viewer
mazzo di carte standard?

Questa domanda è ambigua. Cosa succede quando pesciamo la prima carta? Lo rimettiamo nel mazzo o lo lasciamo fuori?

Iniziamo con il calcolo della probabilità con la sostituzione. Ci sono quattro assi e 52 carte in totale, quindi la probabilità di pescare un asso è 4/52. Se sostituiamo questa carta e pesciamo di nuovo, allora la probabilità è di nuovo 4/52. Questi eventi sono indipendenti, quindi moltiplichiamo le probabilità (4/52) x (4/52) = 1/169, o circa lo 0,592%.

Ora lo confronteremo con la stessa situazione, con l'eccezione che non sostituiamo le carte. La probabilità di pescare un asso al primo pareggio è ancora 4/52. Per la seconda carta, assumiamo che un asso sia già stato pescato. Dobbiamo ora calcolare una probabilità condizionale. In altre parole, dobbiamo sapere qual è la probabilità di pescare un secondo asso, dato che anche la prima carta è un asso.

Ora ci sono ancora tre assi su un totale di 51 carte. Quindi la probabilità condizionale di un secondo asso dopo aver pescato un asso è 3/51. La probabilità di disegnare due assi senza sostituzione è (4/52) x (3/51) = 1/221, o circa lo 0,425%.

Vediamo direttamente dal problema sopra che ciò che scegliamo di fare con la sostituzione ha a che fare con i valori delle probabilità. Può cambiare significativamente questi valori.

Dimensioni della popolazione

Ci sono alcune situazioni in cui il campionamento con o senza sostituzione non modifica sostanzialmente le probabilità. Supponiamo che stiamo scegliendo casualmente due persone da una città con una popolazione di 50.000, di cui 30.000 di queste donne sono donne.

Se campioniamo con la sostituzione, allora la probabilità di scegliere una femmina sulla prima selezione è data da 30000/50000 = 60%. La probabilità di una donna nella seconda selezione è ancora del 60%. La probabilità che entrambe le persone siano femmine è 0.6 x 0.6 = 0.36.

Se campioniamo senza sostituzione, la prima probabilità non viene influenzata. La seconda probabilità è ora 29999/49999 = 0,5999919998..., che è estremamente vicina al 60%. La probabilità che entrambe siano femmine è 0,6 x 0,5999919998 = 0,359995.

Le probabilità sono tecnicamente diverse, tuttavia sono abbastanza vicine da essere quasi indistinguibili. Per questo motivo, molte volte anche se campioniamo senza sostituzione, trattiamo la selezione di ciascun individuo come se fossero indipendenti dagli altri individui nel campione.

Altre applicazioni

Ci sono altri casi in cui dobbiamo considerare se campionare con o senza sostituzione. Su esempio di questo è bootstrap. Questa tecnica statistica rientra nel titolo di una tecnica di ricampionamento.

Nel bootstrap iniziamo con un campione statistico di una popolazione. Quindi utilizziamo il software per calcolare campioni bootstrap. In altre parole, il computer esegue il campionamento con la sostituzione dal campione iniziale.

instagram story viewer