I grafici a scatole prendono il nome da ciò che assomigliano. A volte vengono definiti trame box e baffi. Questi tipi di grafici vengono utilizzati per visualizzare l'intervallo, medianoe quartili. Al termine, una casella contiene il primo e terzo quartile. I baffi si estendono dalla casella ai valori minimo e massimo dei dati.
Le pagine seguenti mostreranno come creare un diagramma a scatole per un set di dati con minimo 20, primo quartile 25, mediana 32, terzo quartile 35 e massimo 43.
Traccia cinque linee verticali sopra la linea numerica, una per ciascuno dei valori del minimo, primo quartile, mediana, terzo quartile e massimo. In genere le linee per il minimo e il massimo sono più corte delle linee per i quartili e la mediana.
Per i nostri dati, il minimo è 20, il primo quartile è 25, la mediana è 32, il terzo quartile è 35 e il massimo è 43. Le linee corrispondenti a questi valori sono disegnate sopra.
Quindi, disegniamo una scatola e usiamo alcune delle linee per guidarci. Il primo quartile è il lato sinistro della nostra scatola. Il terzo quartile è il lato destro della nostra scatola. La mediana cade ovunque all'interno della scatola.
Secondo la definizione del primo e del terzo quartile, la metà di tutti i valori dei dati è contenuta nella casella.
Ora vediamo come un grafico a scatola e baffo ottiene la seconda parte del suo nome. I baffi sono disegnati per dimostrare la gamma dei dati. Traccia una linea orizzontale dalla linea per il minimo al lato sinistro della casella nel primo quartile. Questo è uno dei nostri baffi. Traccia una seconda linea orizzontale dal lato dei diritti del riquadro nel terzo quartile alla linea che rappresenta il massimo dei dati. Questo è il nostro secondo baffo.
Il nostro grafico a scatola e baffo, o boxplot, è ora completo. A prima vista, possiamo determinare l'intervallo dei valori dei dati e il grado in cui tutto è raggruppato. Il passaggio successivo mostra come confrontare e confrontare due grafici a scatole.
I grafici a riquadro e baffi mostrano il riepilogo a cinque numeri di un set di dati. È quindi possibile confrontare due diversi set di dati esaminando insieme i loro grafici a scatole. Sopra un secondo boxplot è stato disegnato sopra quello che abbiamo costruito.
Ci sono un paio di funzioni che meritano di essere menzionate. Il primo è che le mediane di entrambe le serie di dati sono identiche. La linea verticale all'interno di entrambe le caselle si trova nello stesso punto della linea numerica. La seconda cosa da notare sui due grafici a riquadro e baffi è che la trama in alto non è così diffusa in quella in basso. Il bauletto è più piccolo e i baffi non si estendono fino in fondo.
Disegnare due grafici a riquadri sopra la stessa linea numerica suppone che i dati dietro ciascun meritano di essere confrontati. Non avrebbe senso confrontare una trama di altezze di terza elementare con pesi di cani in un rifugio locale. Sebbene entrambi contengano dati sul rapporto livello di misurazione, non c'è motivo di confrontare i dati.
D'altra parte, sarebbe sensato confrontare i grafici a scatole delle altezze di terza elementare se una trama rappresentava i dati dei ragazzi di una scuola e l'altra trama rappresentava i dati delle ragazze di la scuola.