Esistono varie statistiche descrittive. Numeri come la media, mediano, modalità, asimmetria, curtosi, deviazione standard, primo quartile e terzo quartile, per citarne alcuni, ognuno di noi ci dice qualcosa sui nostri dati. Piuttosto che guardare questi statistiche descrittive individualmente, a volte combinarli aiuta a darci un quadro completo. A tal fine, il riepilogo a cinque numeri è un modo conveniente per combinare cinque statistiche descrittive.
Quali cinque numeri?
È chiaro che ci sono cinque numeri nel nostro sommario, ma quali cinque? I numeri scelti servono per aiutarci a conoscere il centro dei nostri dati, nonché la diffusione dei punti dati. Tenendo presente questo, il riepilogo a cinque numeri è composto da:
- Il minimo: questo è il valore più piccolo nel nostro set di dati.
- Il primo quartile: questo numero è indicato Q1 e il 25% dei nostri dati scende al di sotto del primo quartile.
- La mediana: questo è il punto intermedio dei dati. Il 50% di tutti i dati scende al di sotto della mediana.
- Il terzo quartile: questo numero è indicato Q3 e il 75% dei nostri dati scende al di sotto del terzo quartile.
- Il massimo: questo è il valore più grande nel nostro set di dati.
La media e la deviazione standard possono anche essere usate insieme per trasmettere il centro e la diffusione di un insieme di dati. Tuttavia, entrambe queste statistiche sono suscettibili di valori anomali. La mediana, il primo quartile e il terzo quartile non sono così fortemente influenzati dai valori anomali.
Un esempio
Dato il seguente set di dati, segnaleremo il riepilogo dei cinque numeri:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Ci sono un totale di venti punti nel set di dati. La mediana è quindi la media del decimo e dell'undicesimo valore di dati o:
(7 + 8)/2 = 7.5.
La mediana della metà inferiore dei dati è il primo quartile. La metà inferiore è:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Quindi calcoliamoQ1= (4 + 6)/2 = 5.
La mediana della metà superiore del set di dati originale è il terzo quartile. Dobbiamo trovare la mediana di:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Quindi calcoliamoQ3= (15 + 15)/2 = 15.
Mettiamo insieme tutti i risultati di cui sopra e riportiamo che il riepilogo di cinque numeri per l'insieme di dati sopra è 1, 5, 7.5, 12, 20.
Rappresentazione grafica
È possibile confrontare cinque riepiloghi numerici. Scopriremo che due insiemi con mezzi simili e deviazioni standard possono avere sommari di cinque numeri molto diversi. Per confrontare facilmente due riepiloghi di cinque numeri a colpo d'occhio, possiamo usare a boxploto grafico a scatola e baffi.