Molte volte quando studiamo un gruppo, stiamo davvero confrontando due popolazioni. A seconda del parametro di questo gruppo a cui siamo interessati e delle condizioni di cui ci occupiamo, ci sono diverse tecniche disponibili. statistico inferenza le procedure che riguardano il confronto tra due popolazioni di solito non possono essere applicate a tre o più popolazioni. Per studiare più di due popolazioni contemporaneamente, abbiamo bisogno di diversi tipi di strumenti statistici. Analisi della varianza, o ANOVA, è una tecnica di interferenza statistica che ci consente di gestire diverse popolazioni.
Confronto di mezzi
Per vedere quali problemi sorgono e perché abbiamo bisogno dell'ANOVA, prenderemo in considerazione un esempio. Supponiamo che stiamo cercando di determinare se il significare i pesi delle caramelle M&M verdi, rosse, blu e arancioni sono diversi l'uno dall'altro. Indicheremo i pesi medi per ciascuna di queste popolazioni, μ1, μ2, μ3 μ4 e rispettivamente. Possiamo usare l'appropriato test di ipotesi più volte e testare C (4,2) o sei diversi ipotesi nulle:
- H0: μ1 = μ2 per verificare se il peso medio della popolazione delle caramelle rosse è diverso dal peso medio della popolazione delle caramelle blu.
- H0: μ2 = μ3 per verificare se il peso medio della popolazione delle caramelle blu è diverso dal peso medio della popolazione delle caramelle verdi.
- H0: μ3 = μ4 per verificare se il peso medio della popolazione delle caramelle verdi è diverso dal peso medio della popolazione delle caramelle all'arancia.
- H0: μ4 = μ1 per verificare se il peso medio della popolazione delle caramelle all'arancia è diverso dal peso medio della popolazione delle caramelle rosse.
- H0: μ1 = μ3 per verificare se il peso medio della popolazione delle caramelle rosse è diverso dal peso medio della popolazione delle caramelle verdi.
- H0: μ2 = μ4 per verificare se il peso medio della popolazione delle caramelle blu è diverso dal peso medio della popolazione delle caramelle all'arancia.
Ci sono molti problemi con questo tipo di analisi. Ne avremo sei p-valori. Anche se possiamo testare ciascuno al 95% livello di fiducia, la nostra fiducia nel processo complessivo è inferiore a questa perché le probabilità si moltiplicano: .95 x .95 x .95 x .95 x .95 x .95 è circa .74 o un livello di affidabilità del 74%. Pertanto, la probabilità di un errore di tipo I è aumentata.
A un livello più fondamentale, non possiamo confrontare questi quattro parametri nel loro insieme confrontandoli due alla volta. Le medie delle M & M rosse e blu possono essere significative, con il peso medio del rosso relativamente più grande del peso medio del blu. Tuttavia, se consideriamo i pesi medi di tutti e quattro i tipi di caramelle, potrebbe non esserci una differenza significativa.
Analisi della varianza
Per far fronte a situazioni in cui è necessario effettuare confronti multipli, utilizziamo ANOVA. Questo test ci consente di considerare i parametri di più popolazioni contemporaneamente, senza entrare in alcuni dei problemi che ci affrontano condurre test di ipotesi su due parametri alla volta.
Per condurre ANOVA con l'esempio M&M sopra, verificheremmo l'ipotesi nulla H0:μ1 = μ2 = μ3= μ4. Ciò afferma che non vi è alcuna differenza tra i pesi medi delle M & M rosse, blu e verdi. L'ipotesi alternativa è che ci sia qualche differenza tra i pesi medi delle M & M rosse, blu, verdi e arancioni. Questa ipotesi è davvero una combinazione di diverse affermazioni Hun':
- Il peso medio della popolazione di caramelle rosse non è uguale al peso medio della popolazione di caramelle blu, OR
- Il peso medio della popolazione di caramelle blu non è uguale al peso medio della popolazione di caramelle verdi, OR
- Il peso medio della popolazione di caramelle verdi non è uguale al peso medio della popolazione di caramelle all'arancia, OR
- Il peso medio della popolazione di caramelle verdi non è uguale al peso medio della popolazione di caramelle rosse, OR
- Il peso medio della popolazione di caramelle blu non è uguale al peso medio della popolazione di caramelle all'arancia, OR
- Il peso medio della popolazione di caramelle blu non è uguale al peso medio della popolazione di caramelle rosse.
In questo caso particolare, al fine di ottenere il nostro valore p, utilizzeremmo a distribuzione di probabilità Conosciuto come il F-distribution. I calcoli che prevedono il test ANOVA F possono essere eseguiti a mano, ma in genere vengono calcolati con software statistico.
Confronti multipli
Ciò che separa ANOVA da altre tecniche statistiche è che viene utilizzato per effettuare confronti multipli. Questo è comune in tutte le statistiche, poiché ci sono molte volte in cui vogliamo confrontare più di due soli gruppi. Tipicamente un test generale suggerisce che esiste una sorta di differenza tra i parametri che stiamo studiando. Seguiamo quindi questo test con qualche altra analisi per decidere quale parametro differisce.