Che cos'è la regola di intervallo interquartile?

La regola dell'intervallo interquartile è utile per rilevare la presenza di valori anomali. Valori anomali sono valori individuali che non rientrano nel modello generale di un set di dati. Questa definizione è alquanto vaga e soggettiva, quindi è utile avere una regola da applicare quando determinare se un punto dati è veramente un valore anomalo: è qui che si trova la regola dell'intervallo interquartile entra.

Qualsiasi set di dati può essere descritto dal suo sommario di cinque numeri. Questi cinque numeri, che ti danno le informazioni di cui hai bisogno per trovare schemi e valori anomali, sono costituiti da (in ordine crescente):

Questi cinque numeri dicono a una persona di più sui propri dati che guardare i numeri tutti in una volta potrebbe, o almeno rendere questo molto più semplice. Ad esempio, il gamma, che è il minimo sottratto dal massimo, è un indicatore di come i dati sono distribuiti in un set (nota: l'intervallo è altamente sensibile agli outlier: se un outlier è anche un minimo o massimo, l'intervallo non sarà una rappresentazione accurata dell'ampiezza di un dato impostato).

instagram viewer

Altrimenti sarebbe difficile estrapolare altrimenti. Simile all'intervallo ma meno sensibile agli outlier è l'intervallo interquartile. Il intervallo interquartile viene calcolato più o meno allo stesso modo dell'intervallo. Tutto quello che fai per trovarlo è sottrarre il primo quartile dal terzo quartile:

L'intervallo interquartile mostra come i dati sono sparsi sulla mediana. È meno suscettibile dell'intervallo ai valori anomali e può quindi essere più utile.

Sebbene non siano spesso influenzati molto da loro, l'intervallo interquartile può essere utilizzato per rilevare valori anomali. Questo viene fatto usando questi passaggi:

Ricorda che la regola interquartile è solo una regola empirica che generalmente vale ma non si applica a tutti i casi. In generale, dovresti sempre seguire le tue analisi anomale studiando gli outlier risultanti per vedere se hanno senso. Qualsiasi potenziale valore anomalo ottenuto con il metodo interquartile dovrebbe essere esaminato nel contesto dell'intera serie di dati.

Vedi la regola dell'intervallo interquartile al lavoro con un esempio. Supponiamo di avere il seguente set di dati: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Il riepilogo a cinque numeri per questo set di dati è minimo = 1, primo quartile = 4, mediana = 7, terzo quartile = 10 e massimo = 17. Puoi guardare i dati e dire automaticamente che 17 è un valore anomalo, ma cosa dice la regola dell'intervallo interquartile?

Ora moltiplica la tua risposta per 1,5 per ottenere 1,5 x 6 = 9. Nove meno del primo quartile è 4 - 9 = -5. Nessun dato è inferiore a questo. Nove più del terzo quartile è 10 + 9 = 19. Nessun dato è maggiore di questo. Nonostante il valore massimo sia cinque in più rispetto al punto dati più vicino, la regola dell'intervallo interquartile mostra che probabilmente non dovrebbe essere considerato un valore anomalo per questo set di dati.

instagram story viewer