Un'introduzione alla gamma interquartile

L'intervallo interquartile (IQR) è la differenza tra il primo quartile e il terzo quartile. La formula per questo è:

IQR = Q3 - Q1

Esistono molte misurazioni della variabilità di un insieme di dati. Entrambi i gamma e deviazione standard dicci come sono distribuiti i nostri dati. Il problema con queste statistiche descrittive è che sono abbastanza sensibili ai valori anomali. Una misura della diffusione di un set di dati che è più resistente alla presenza di valori anomali è l'intervallo interquartile.

Definizione di Interquartile Range

Come visto sopra, l'intervallo interquartile si basa sul calcolo di altre statistiche. Prima di determinare l'intervallo interquartile, dobbiamo prima conoscere i valori del primo quartile e del terzo quartile. (Naturalmente, il primo e il terzo quartile dipendono dal valore della mediana).

Dopo aver determinato i valori del primo e del terzo quartile, l'intervallo interquartile è molto facile da calcolare. Tutto quello che dobbiamo fare è sottrarre il primo quartile dal terzo quartile. Questo spiega l'uso del termine intervallo interquartile per questa statistica.

instagram viewer

Esempio

Per vedere un esempio del calcolo di un intervallo interquartile, considereremo l'insieme di dati: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. Il riepilogo di cinque numeri per questo set di dati è:

  • Minimo 2
  • Primo quartile di 3.5
  • Mediana di 6
  • Terzo quartile di 8
  • Massimo 9

Quindi vediamo che l'intervallo interquartile è 8 - 3,5 = 4,5.

Il significato della gamma interquartile

La gamma ci fornisce una misura di quanto sia estesa la totalità del nostro set di dati. La gamma interquartile, che ci dice quanto distanti primo e terzo quartile sono, indica quanto è distribuito il 50% medio della nostra serie di dati.

Resistenza ai valori anomali

Il vantaggio principale dell'utilizzo dell'intervallo interquartile anziché dell'intervallo per la misurazione della diffusione di un set di dati è che l'intervallo interquartile non è sensibile agli outlier. Per vedere questo, vedremo un esempio.

Dall'insieme di dati sopra abbiamo un intervallo interquartile di 3,5, un intervallo di 9 - 2 = 7 e una deviazione standard di 2,34. Se sostituiamo il valore più alto di 9 con un outlier estremo di 100, la deviazione standard diventa 27,37 e l'intervallo è 98. Anche se abbiamo cambiamenti abbastanza drastici di questi valori, il primo e il terzo quartile non sono interessati e quindi l'intervallo interquartile non cambia.

Uso della gamma interquartile

Oltre ad essere una misura meno sensibile della diffusione di un set di dati, l'intervallo interquartile ha un altro uso importante. A causa della sua resistenza ai valori anomali, l'intervallo interquartile è utile per identificare quando un valore è un valore anomalo.

Il regola dell'intervallo interquartile è ciò che ci informa se abbiamo un outlier lieve o forte. Per cercare un valore anomalo, dobbiamo guardare sotto il primo quartile o sopra il terzo quartile. Quanto dovremmo andare dipende dal valore dell'intervallo interquartile.

instagram story viewer