Comprensione degli istogrammi di frequenza relativa

Nel statistica, ci sono molti termini che hanno sottili distinzioni tra loro. Un esempio di ciò è la differenza tra frequenza e frequenza relativa. Sebbene ci siano molti usi per le frequenze relative, ce n'è uno in particolare che coinvolge un istogramma di frequenza relativa. Questo è un tipo di grafico che ha connessioni ad altri argomenti nelle statistiche e nelle statistiche matematiche.

Definizione

Gli istogrammi sono grafici statistici che sembrano grafici a barre. In genere, tuttavia, il termine istogramma è riservato per quantitativo variabili. L'asse orizzontale di un istogramma è una linea numerica contenente classi o bidoni di lunghezza uniforme. Questi bin sono intervalli di una riga numerica in cui i dati possono cadere e possono consistere in un singolo numero (in genere per discreto set di dati relativamente piccoli) o un intervallo di valori (per set di dati discreti più grandi e continuo dati).

Ad esempio, potremmo essere interessati a considerare la distribuzione dei punteggi su un quiz di 50 punti per una classe di studenti. Un modo possibile per costruire i bin sarebbe quello di avere un cestino diverso per ogni 10 punti.

instagram viewer

L'asse verticale di un istogramma rappresenta il conteggio o la frequenza in cui si verifica un valore di dati in ciascuno dei bin. Più è alta la barra, più valori di dati rientrano in questo intervallo di valori bin. Per tornare al nostro esempio, se ci sono cinque studenti che hanno segnato più di 40 punti nel quiz, la barra corrispondente al cestino da 40 a 50 sarà alta cinque unità.

Confronto istogramma di frequenza

Un istogramma di frequenza relativa è una modifica minore di un tipico istogramma di frequenza. Anziché utilizzare un asse verticale per il conteggio dei valori dei dati che rientrano in un determinato contenitore, utilizziamo questo asse per rappresentare la proporzione complessiva dei valori dei dati che rientrano in questo contenitore. Dal 100% = 1, tutte le barre devono avere un'altezza da 0 a 1. Inoltre, le altezze di tutte le barre nel nostro istogramma di frequenza relativa devono essere pari a 1.

Quindi, nell'esempio corrente che abbiamo visto, supponiamo che ci siano 25 studenti nella nostra classe e cinque abbiano segnato più di 40 punti. Invece di costruire una barra di altezza cinque per questo cestino, avremmo una barra di altezza 5/25 = 0,2.

Confrontando un istogramma con un istogramma di frequenza relativa, ciascuno con gli stessi bin, noteremo qualcosa. La forma complessiva degli istogrammi sarà identica. Un istogramma di frequenza relativa non enfatizza i conteggi complessivi in ​​ogni bin. Invece, questo tipo di grafico si concentra sul modo in cui il numero di valori dei dati nel cestino è correlato agli altri bin. Il modo in cui mostra questa relazione è in percentuale del numero totale di valori di dati.

Funzioni di massa di probabilità

Potremmo chiederci quale sia il punto nel definire un istogramma di frequenza relativa. Un'applicazione chiave si riferisce a variabili casuali discrete in cui i nostri bin sono di larghezza 1 e sono centrati su ogni intero non negativo. In questo caso, possiamo definire una funzione a tratti con valori corrispondenti alle altezze verticali delle barre nel nostro istogramma di frequenza relativa.

Questo tipo di funzione è chiamata funzione di massa di probabilità. La ragione per costruire la funzione in questo modo è che la curva definita dalla funzione ha una connessione diretta probabilità. L'area sotto la curva dai valori un' per B è la probabilità che la variabile casuale abbia un valore da un' per B.

La connessione tra probabilità e area sotto la curva è quella che si presenta ripetutamente nelle statistiche matematiche. L'uso di una funzione di massa di probabilità per modellare un istogramma di frequenza relativa è un'altra di queste connessioni.

instagram story viewer