Esempio di test di permutazione

click fraud protection

Una domanda che è sempre importante porre statistica è: “Il risultato osservato è dovuto solo al caso o è così statisticamente significante?” Una classe di test di ipotesi, chiamati test di permutazione, ci consentono di testare questa domanda. La panoramica e i passaggi di tale test sono:

  • Abbiamo diviso i nostri soggetti in un gruppo di controllo e un gruppo sperimentale. L'ipotesi nulla è che non vi siano differenze tra questi due gruppi.
  • Applica un trattamento al gruppo sperimentale.
  • Misura la risposta al trattamento
  • Considera ogni possibile configurazione del gruppo sperimentale e la risposta osservata.
  • Calcola un valore p basato sulla nostra risposta osservata relativa a tutti i potenziali gruppi sperimentali.

Questo è lo schema di una permutazione. Alla base di questo schema, passeremo il tempo a guardare in dettaglio un esempio elaborato di tale test di permutazione.

Esempio

Supponiamo di studiare topi. In particolare, siamo interessati a quanto velocemente i topi finiscono un labirinto che non hanno mai incontrato prima. Desideriamo fornire prove a favore di un trattamento sperimentale. L'obiettivo è dimostrare che i topi nel gruppo di trattamento risolveranno il labirinto più rapidamente rispetto ai topi non trattati.

instagram viewer

Iniziamo con i nostri soggetti: sei topi. Per comodità, i topi saranno indicati dalle lettere A, B, C, D, E, F. Tre di questi topi devono essere selezionati in modo casuale per il trattamento sperimentale, e gli altri tre vengono inseriti in un gruppo di controllo in cui i soggetti ricevono un placebo.

Sceglieremo a caso l'ordine in cui i topi vengono selezionati per eseguire il labirinto. Il tempo impiegato per terminare il labirinto per tutti i topi verrà notato e verrà calcolata la media di ciascun gruppo.

Supponiamo che la nostra selezione casuale abbia topi A, C ed E nel gruppo sperimentale, con gli altri topi nel placebo gruppo di controllo. Dopo che il trattamento è stato implementato, scegliamo casualmente l'ordine per i topi di correre attraverso il labirinto.

I tempi di esecuzione per ciascuno dei topi sono:

  • Il mouse A esegue la gara in 10 secondi
  • Il mouse B esegue la gara in 12 secondi
  • Il mouse C esegue la gara in 9 secondi
  • Il mouse D esegue la gara in 11 secondi
  • Il mouse E esegue la gara in 11 secondi
  • Il mouse F esegue la gara in 13 secondi.

Il tempo medio per completare il labirinto per i topi nel gruppo sperimentale è di 10 secondi. Il tempo medio per completare il labirinto per quelli nel gruppo di controllo è di 12 secondi.

Potremmo fare un paio di domande. Il trattamento è davvero il motivo del tempo medio più veloce? O siamo stati solo fortunati nella nostra selezione di controllo e gruppo sperimentale? Il trattamento potrebbe non aver avuto alcun effetto e abbiamo scelto casualmente i topi più lenti a ricevere il placebo e i topi più veloci a ricevere il trattamento. Un test di permutazione aiuterà a rispondere a queste domande.

ipotesi

Le ipotesi per il nostro test di permutazione sono:

  • Il ipotesi nulla è l'affermazione di nessun effetto. Per questo test specifico, abbiamo H0: Non vi è alcuna differenza tra i gruppi di trattamento. Il tempo medio per eseguire il labirinto per tutti i topi senza trattamento è uguale al tempo medio per tutti i topi con il trattamento.
  • L'ipotesi alternativa è ciò che stiamo cercando di stabilire prove a favore. In questo caso, avremmo Hun': Il tempo medio per tutti i topi con il trattamento sarà più veloce del tempo medio per tutti i topi senza il trattamento.

permutazioni

Ci sono sei topi e ci sono tre posti nel gruppo sperimentale. Ciò significa che il numero di possibili gruppi sperimentali è dato dal numero di combinazioni C (6,3) = 6! / (3! 3!) = 20. I restanti individui faranno parte del gruppo di controllo. Quindi ci sono 20 modi diversi per scegliere casualmente le persone nei nostri due gruppi.

L'assegnazione di A, C ed E al gruppo sperimentale è stata fatta in modo casuale. Poiché ci sono 20 di tali configurazioni, quella specifica con A, C ed E nel gruppo sperimentale ha una probabilità di 1/20 = 5% di occorrenza.

Dobbiamo determinare tutte e 20 le configurazioni del gruppo sperimentale degli individui nel nostro studio.

  1. Gruppo sperimentale: A B C e gruppo di controllo: D E F
  2. Gruppo sperimentale: A B D e gruppo di controllo: C E F
  3. Gruppo sperimentale: A B E e gruppo di controllo: C D F
  4. Gruppo sperimentale: A B F e gruppo di controllo: C D E
  5. Gruppo sperimentale: A C D e gruppo di controllo: B E F
  6. Gruppo sperimentale: A C E e gruppo di controllo: B D F
  7. Gruppo sperimentale: A C F e gruppo di controllo: B D E
  8. Gruppo sperimentale: A D E e gruppo di controllo: B C F
  9. Gruppo sperimentale: A D F e gruppo di controllo: B C E
  10. Gruppo sperimentale: A E F e gruppo di controllo: B C D
  11. Gruppo sperimentale: B C D e gruppo di controllo: A E F
  12. Gruppo sperimentale: B C E e gruppo di controllo: A D F
  13. Gruppo sperimentale: B C F e gruppo di controllo: A D E
  14. Gruppo sperimentale: B D E e gruppo di controllo: A C F
  15. Gruppo sperimentale: B D F e gruppo di controllo: A C E
  16. Gruppo sperimentale: B E F e gruppo di controllo: A C D
  17. Gruppo sperimentale: C D E e gruppo di controllo: A B F
  18. Gruppo sperimentale: C D F e gruppo di controllo: A B E
  19. Gruppo sperimentale: C E F e gruppo di controllo: A B D
  20. Gruppo sperimentale: D E F e gruppo di controllo: A B C

Analizziamo quindi ogni configurazione di gruppi sperimentali e di controllo. Calcoliamo la media per ciascuna delle 20 permutazioni nell'elenco sopra. Ad esempio, per il primo, A, B e C hanno tempi rispettivamente di 10, 12 e 9. La media di questi tre numeri è 10.3333. Anche in questa prima permutazione, D, E e F hanno tempi rispettivamente di 11, 11 e 13. Questo ha una media di 11.6666.

Dopo aver calcolato il media di ciascun gruppo, calcoliamo la differenza tra questi mezzi. Ognuno dei seguenti corrisponde alla differenza tra i gruppi sperimentali e di controllo elencati sopra.

  1. Placebo - Trattamento = 1.333333333 secondi
  2. Placebo - Trattamento = 0 secondi
  3. Placebo - Trattamento = 0 secondi
  4. Placebo - Trattamento = -1.333333333 secondi
  5. Placebo - Trattamento = 2 secondi
  6. Placebo - Trattamento = 2 secondi
  7. Placebo - Trattamento = 0,666666667 secondi
  8. Placebo - Trattamento = 0,666666667 secondi
  9. Placebo - Trattamento = -0.666666667 secondi
  10. Placebo - Trattamento = -0.666666667 secondi
  11. Placebo - Trattamento = 0,666666667 secondi
  12. Placebo - Trattamento = 0,666666667 secondi
  13. Placebo - Trattamento = -0.666666667 secondi
  14. Placebo - Trattamento = -0.666666667 secondi
  15. Placebo - Trattamento = -2 secondi
  16. Placebo - Trattamento = -2 secondi
  17. Placebo - Trattamento = 1.333333333 secondi
  18. Placebo - Trattamento = 0 secondi
  19. Placebo - Trattamento = 0 secondi
  20. Placebo - Trattamento = -1.333333333 secondi

P-Valore

Ora classifichiamo le differenze tra i mezzi di ciascun gruppo che abbiamo notato sopra. Tabuliamo anche la percentuale delle nostre 20 diverse configurazioni che sono rappresentate da ciascuna differenza di mezzi. Ad esempio, quattro dei 20 non avevano alcuna differenza tra i mezzi dei gruppi di controllo e quelli di trattamento. Ciò rappresenta il 20% delle 20 configurazioni sopra indicate.

  • -2 per il 10%
  • -1,33 per il 10%
  • -0,667 per il 20%
  • 0 per il 20%
  • 0.667 per il 20%
  • 1,33 per il 10%
  • 2 per il 10%.

Qui confrontiamo questo elenco con il nostro risultato osservato. La nostra selezione casuale di topi per i gruppi di trattamento e controllo ha comportato una differenza media di 2 secondi. Vediamo anche che questa differenza corrisponde al 10% di tutti i possibili campioni. Il risultato è che per questo studio abbiamo un p-value del 10%.

instagram story viewer