La gamma di set di dati statistici

In statistica e matematica, l'intervallo è la differenza tra i valori massimo e minimo di un set di dati e funge da una delle due caratteristiche importanti di un set di dati. La formula per un intervallo è il valore massimo meno il valore minimo nel set di dati, che fornisce agli statistici una migliore comprensione della variabilità del set di dati.

Due caratteristiche importanti di un set di dati includono il centro dei dati e la diffusione dei dati, e il centro può esseremisurato in vari modi: i più popolari di questi sono i medi, mediano, mode e midrange, ma in modo simile, esistono diversi modi per calcolare la diffusione del set di dati e la misura più semplice e più grossolana di diffusione è chiamata intervallo.

Il calcolo dell'intervallo è molto semplice. Tutto quello che dobbiamo fare è trovare la differenza tra il valore di dati più grande nel nostro set e il valore di dati più piccolo. Detto in breve, abbiamo la seguente formula: Range = Valore massimo – Valore minimo. Ad esempio, il set di dati 4,6,10, 15, 18 ha un massimo di 18, un minimo di 4 e un intervallo di

instagram viewer
18-4 = 14.

L'intervallo è una misurazione molto grossolana della diffusione dei dati perché è estremamente sensibile agli outlier e, di conseguenza, ci sono alcuni limitazioni all'utilità di un intervallo reale di un set di dati per gli statistici poiché un singolo valore di dati può influire notevolmente sul valore del gamma.

Ad esempio, considerare l'insieme di dati 1, 2, 3, 4, 6, 7, 7, 8. Il valore massimo è 8, il minimo è 1 e l'intervallo è 7. Quindi prendere in considerazione lo stesso set di dati, solo con il valore 100 incluso. La gamma ora diventa 100-1 = 99 in cui l'aggiunta di un singolo punto dati aggiuntivo ha influenzato notevolmente il valore dell'intervallo. La deviazione standard è un'altra misura della diffusione che è meno suscettibile agli outlier, ma lo svantaggio è che calcolo della deviazione standard è molto più complicato.

La gamma non ci dice nulla sulle funzionalità interne del nostro set di dati. Ad esempio, consideriamo il set di dati 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 dove l'intervallo per questo set di dati è 10-1 = 9. Se poi lo confrontiamo con il set di dati di 1, 1, 1, 2, 9, 9, 9, 10. Qui l'intervallo è, ancora una volta, nove, tuttavia, per questo secondo set e, diversamente dal primo set, i dati sono raggruppati attorno al minimo e al massimo. Altre statistiche, come il primo e il terzo quartile, dovrebbero essere utilizzate per rilevare parte di questa struttura interna.

L'intervallo è un buon modo per ottenere una comprensione molto semplice di come i numeri sparsi nel set di dati sono davvero perché è facile calcola poiché richiede solo un'operazione aritmetica di base, ma ci sono anche alcune altre applicazioni dell'intervallo di un set di dati in statistiche.

L'intervallo può essere utilizzato anche per stimare un'altra misura di diffusione, la deviazione standard. Invece di passare attraverso una formula abbastanza complicata per trovare la deviazione standard, possiamo invece usare ciò che viene chiamato regola del range. L'intervallo è fondamentale in questo calcolo.

L'intervallo si verifica anche in a boxploto trama di scatole e baffi. I valori massimo e minimo sono entrambi rappresentati alla fine dei baffi del grafico e la lunghezza totale dei baffi e della scatola è uguale all'intervallo.

instagram story viewer