Il mediano di un insieme di dati è il punto intermedio in cui esattamente la metà dei valori dei dati è inferiore o uguale alla mediana. In modo simile, possiamo pensare alla mediana di a continuodistribuzione di probabilità, ma piuttosto che trovare il valore medio in un insieme di dati, troviamo il centro della distribuzione in un modo diverso.
L'area totale sotto una funzione di densità di probabilità è 1, che rappresenta il 100% e, di conseguenza, la metà di questa può essere rappresentata dalla metà o dal 50%. Una delle grandi idee delle statistiche matematiche è che la probabilità è rappresentata dall'area sotto la curva del funzione di densità, che è calcolata da un integrale, e quindi la mediana di una distribuzione continua è il punto il numero reale linea in cui esattamente la metà dell'area si trova a sinistra.
Ciò può essere affermato più succintamente dal seguente integrale improprio. La mediana della variabile casuale continua X con funzione di densità f( X) è il valore M tale che:
0.5=∫m−∞f(X)dX
Mediana per distribuzione esponenziale
Calcoliamo ora la mediana per la distribuzione esponenziale Exp (A). Una variabile casuale con questa distribuzione ha funzione di densità f(X) = e-X/UN/ A per X qualsiasi numero reale non negativo. La funzione contiene anche il costante matematica e, approssimativamente uguale a 2.71828.
Poiché la funzione di densità di probabilità è zero per qualsiasi valore negativo di X, tutto ciò che dobbiamo fare è integrare quanto segue e risolvere per M:
0,5 = ∫0M f (x) dx
Dal momento che l'integrale ∫ e-X/UN/Anno DominiX = -e-X/UN, il risultato è quello
0,5 = -e-M / A + 1
Ciò significa che 0,5 = e-M / A e dopo aver preso il logaritmo naturale di entrambi i lati dell'equazione, abbiamo:
ln (1/2) = -M / A
Da 1/2 = 2-1, per proprietà dei logaritmi scriviamo:
- ln2 = -M / A
Moltiplicare entrambi i lati per A ci dà il risultato che la mediana M = A ln2.
Disuguaglianza media-media nelle statistiche
Una conseguenza di questo risultato dovrebbe essere menzionata: la media della distribuzione esponenziale Exp (A) è A, e poiché ln2 è inferiore a 1, ne consegue che il prodotto Aln2 è inferiore a A. Ciò significa che la mediana della distribuzione esponenziale è inferiore alla media.
Questo ha senso se pensiamo al grafico della funzione di densità di probabilità. A causa della coda lunga, questa distribuzione è inclinata a destra. Molte volte quando una distribuzione è inclinata a destra, la media è a destra della mediana.
Ciò che ciò significa in termini di analisi statistica è che spesso possiamo prevedere che media e mediana non lo fanno direttamente correlato data la probabilità che i dati siano inclinati a destra, che possono essere espressi come prova della disuguaglianza media-mediana conosciuto come Disuguaglianza di Chebyshev.
Ad esempio, considera un set di dati che presuppone che una persona riceva un totale di 30 visitatori in 10 ore, in cui il tempo medio di attesa per un visitatore è di 20 minuti, mentre l'insieme di dati potrebbe presentare che il tempo medio di attesa sarebbe compreso tra 20 e 30 minuti se oltre la metà di questi visitatori arrivasse nei primi cinque ore.