La disuguaglianza di Chebyshev nella probabilità

La disuguaglianza di Chebyshev dice che almeno 1-1 /K2 dei dati di un campione deve rientrare in K deviazioni standard dalla media (qui K è positivo numero reale maggiore di uno).

Qualsiasi set di dati che viene normalmente distribuito o nella forma di a campana curva, ha diverse funzionalità. Uno di questi riguarda la diffusione dei dati in relazione al numero di deviazioni standard dalla media. In una distribuzione normale, sappiamo che il 68% dei dati è una deviazione standard dalla media, il 95% è due deviazioni standard dalla media e circa il 99% è entro tre deviazioni standard dalla media.

Ma se il set di dati non è distribuito nella forma di una curva a campana, una quantità diversa potrebbe trovarsi all'interno di una deviazione standard. La disuguaglianza di Chebyshev fornisce un modo per sapere in quale frazione di dati rientra K deviazioni standard dalla media per qualunque set di dati.

Fatti sulla disuguaglianza

Possiamo anche affermare la disuguaglianza sopra sostituendo la frase "dati da un campione" con

instagram viewer
distribuzione di probabilità. Questo perché la disuguaglianza di Chebyshev è il risultato della probabilità, che può quindi essere applicata alle statistiche.

È importante notare che questa disuguaglianza è un risultato che è stato dimostrato matematicamente. Non è come il relazione empirica tra la media e la modalità, oppure il regola del pollice che collega l'intervallo e la deviazione standard.

Illustrazione della disuguaglianza

Per illustrare la disuguaglianza, esamineremo alcuni valori di K:

  • Per K = 2 abbiamo 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Quindi la disuguaglianza di Chebyshev afferma che almeno il 75% dei valori dei dati di qualsiasi distribuzione deve essere compreso tra due deviazioni standard della media.
  • Per K = 3 abbiamo 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Quindi la disuguaglianza di Chebyshev afferma che almeno l'89% dei valori dei dati di qualsiasi distribuzione deve trovarsi entro tre deviazioni standard della media.
  • Per K = 4 abbiamo 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93.75%. Quindi la disuguaglianza di Chebyshev afferma che almeno il 93,75% dei valori dei dati di qualsiasi distribuzione deve essere compreso tra due deviazioni standard della media.

Esempio

Supponiamo di aver campionato i pesi dei cani nel canile locale e di aver scoperto che il nostro campione ha una media di 20 libbre con una deviazione standard di 3 libbre. Con l'uso della disuguaglianza di Chebyshev, sappiamo che almeno il 75% dei cani che abbiamo campionato ha pesi che sono due deviazioni standard dalla media. Due volte la deviazione standard ci dà 2 x 3 = 6. Sottrai e aggiungi questo dalla media di 20. Questo ci dice che il 75% dei cani ha un peso da 14 a 26 libbre.

Uso della disuguaglianza

Se sappiamo di più sulla distribuzione con cui stiamo lavorando, di solito possiamo garantire che un numero maggiore di deviazioni standard si discosta dalla media. Ad esempio, se sappiamo che abbiamo una distribuzione normale, il 95% dei dati è due deviazioni standard dalla media. La disuguaglianza di Chebyshev dice che in questa situazione lo sappiamo almeno Il 75% dei dati è due deviazioni standard dalla media. Come possiamo vedere in questo caso, potrebbe essere molto più di questo 75%.

Il valore della disuguaglianza è che ci fornisce uno scenario di "caso peggiore" in cui le uniche cose che sappiamo sui nostri dati di esempio (o distribuzione di probabilità) sono la media e deviazione standard. Quando non sappiamo nient'altro sui nostri dati, la disuguaglianza di Chebyshev fornisce ulteriori spunti su quanto sia estesa la serie di dati.

Storia della disuguaglianza

La disuguaglianza prende il nome dal matematico russo Pafnuty Chebyshev, che per primo dichiarò la disuguaglianza senza prove nel 1874. Dieci anni dopo, la disuguaglianza è stata dimostrata da Markov nel suo Ph. D. tesi di laurea. A causa delle variazioni nel modo di rappresentare l'alfabeto russo in inglese, è Chebyshev anche scritto come Tchebysheff.

instagram story viewer