Come trovare i gradi di libertà nelle statistiche

Molti problemi di inferenza statistica ci richiedono di trovare il numero di gradi di libertà. Il numero di gradi di libertà seleziona un singolo distribuzione di probabilità tra infiniti. Questo passaggio è un dettaglio spesso trascurato ma cruciale in entrambi i calcoli diintervalli di confidenza e il funzionamento di test di ipotesi.

Non esiste un'unica formula generale per il numero di gradi di libertà. Tuttavia, ci sono formule specifiche utilizzate per ogni tipo di procedura nelle statistiche inferenziali. In altre parole, l'impostazione in cui stiamo lavorando determinerà il numero di gradi di libertà. Quello che segue è un elenco parziale di alcune delle procedure di inferenza più comuni, insieme al numero di gradi di libertà utilizzati in ciascuna situazione.

Distribuzione normale standard

Procedure che coinvolgono distribuzione normale standard sono elencati per completezza e per chiarire alcune idee sbagliate. Queste procedure non ci richiedono di trovare il numero di gradi di libertà. La ragione di ciò è che esiste un'unica distribuzione normale standard. Questi tipi di procedure comprendono quelli che coinvolgono una media della popolazione quando la deviazione standard della popolazione è già nota e anche procedure relative alle proporzioni della popolazione.

instagram viewer

Un esempio di procedure T.

A volte la pratica statistica ci impone di utilizzare la distribuzione t di Student. Per queste procedure, come quelle che hanno a che fare con una media della popolazione con deviazione standard della popolazione sconosciuta, il numero di gradi di libertà è uno in meno della dimensione del campione. Quindi se la dimensione del campione è n, poi ci sono n - 1 grado di libertà.

Procedure T con dati associati

Molte volte ha senso considera i dati come accoppiati. L'accoppiamento viene eseguito in genere a causa di una connessione tra il primo e il secondo valore nella nostra coppia. Molte volte accoppiamo le misurazioni prima e dopo. Il nostro campione di dati associati non è indipendente; tuttavia, la differenza tra ogni coppia è indipendente. Quindi se il campione ha un totale di n coppie di punti dati, (per un totale di 2n valori) poi ci sono n - 1 grado di libertà.

Procedure T per due popolazioni indipendenti

Per questi tipi di problemi, stiamo ancora usando a t-distribution. Questa volta c'è un campione di ciascuna delle nostre popolazioni. Sebbene sia preferibile che questi due campioni abbiano le stesse dimensioni, ciò non è necessario per le nostre procedure statistiche. Quindi possiamo avere due campioni di dimensioni n1 e n2. Esistono due modi per determinare il numero di gradi di libertà. Il metodo più accurato è utilizzare la formula di Welch, una formula computazionalmente ingombrante che coinvolge le dimensioni del campione e le deviazioni standard del campione. Un altro approccio, indicato come approssimazione conservativa, può essere utilizzato per stimare rapidamente i gradi di libertà. Questo è semplicemente il più piccolo dei due numeri n1 - 1 e n2 - 1.

Chi-Square per l'indipendenza

Un uso di test chi-quadro è vedere se due variabili categoriali, ciascuna con diversi livelli, mostrano indipendenza. Le informazioni su queste variabili sono registrate in a tavolo a due vie con r righe e c colonne. Il numero di gradi di libertà è il prodotto (r - 1)(c - 1).

Bontà di chi-quadrato di adattamento

La bontà chi-quadro dell'adattamento inizia con una singola variabile categoriale per un totale di n livelli. Testiamo l'ipotesi che questa variabile corrisponda a un modello predeterminato. Il numero di gradi di libertà è uno in meno rispetto al numero di livelli. In altre parole, ci sono n - 1 grado di libertà.

One Factor ANOVA

Un fattore analisi della varianza (ANOVA) ci consente di fare confronti tra più gruppi, eliminando la necessità di più test di ipotesi a coppie. Dato che il test ci richiede di misurare sia la variazione tra diversi gruppi sia la variazione all'interno di ciascun gruppo, finiamo con due gradi di libertà. Il F-statistica, che viene utilizzato per un fattore ANOVA, è una frazione. Il numeratore e il denominatore hanno ciascuno gradi di libertà. Permettere c essere il numero di gruppi e n è il numero totale di valori di dati. Il numero di gradi di libertà per il numeratore è uno in meno rispetto al numero di gruppi, oppure c - 1. Il numero di gradi di libertà per il denominatore è il numero totale di valori di dati, meno il numero di gruppi o n - c.

È chiaro che dobbiamo stare molto attenti a sapere con quale procedura di inferenza stiamo lavorando. Questa conoscenza ci informerà del numero corretto di gradi di libertà da usare.

instagram story viewer