Il termine campana curva è usato per descrivere il concetto matematico chiamato distribuzione normale, a volte indicato come distribuzione gaussiana. "Curva a campana" si riferisce alla forma a campana che viene creata quando viene tracciata una linea utilizzando i punti dati per un elemento che soddisfa i criteri di distribuzione normale.
In una curva a campana, il centro contiene il maggior numero di un valore e, pertanto, è il punto più alto sull'arco della linea. Questo punto è riferito al significare, ma in termini semplici, è il numero più alto di occorrenze di un elemento (in termini statistici, la modalità).
Distribuzione normale
La cosa importante da notare a distribuzione normale è che la curva è concentrata al centro e diminuisce su entrambi i lati. Ciò è significativo in quanto i dati hanno meno tendenza a produrre valori insolitamente estremi, chiamati outlier, rispetto ad altre distribuzioni. Inoltre, la curva a campana indica che i dati sono simmetrici. Ciò significa che è possibile creare ragionevoli aspettative sulla possibilità che un risultato risieda all'interno di un intervallo a sinistra o a destra del centro, dopo aver misurato la quantità di deviazione contenuta nei dati. Questo è misurato in termini di
deviazioni standard.Un grafico della curva a campana dipende da due fattori: la media e la deviazione standard. La media identifica la posizione del centro e la deviazione standard determina l'altezza e la larghezza della campana. Ad esempio, una grande deviazione standard crea una campana che è corta e larga mentre una piccola deviazione standard crea una curva alta e stretta.
Probabilità della curva della campana e deviazione standard
Per comprendere i fattori di probabilità di una distribuzione normale, è necessario comprendere le seguenti regole:
- L'area totale sotto la curva è uguale a 1 (100%)
- Circa il 68% dell'area sotto la curva rientra in una deviazione standard.
- Circa il 95% dell'area sotto la curva rientra in due deviazioni standard.
- Circa il 99,7% dell'area sotto la curva rientra in tre deviazioni standard.
Gli articoli 2, 3 e 4 sopra sono talvolta indicati come regola empirica o regola 68–95–99.7. Dopo aver determinato che i dati sono normalmente distribuiti (campana curva) e calcola la media e deviazione standard, è possibile determinare il probabilità che un singolo punto dati rientrerà in una determinata gamma di possibilità.
Esempio di curva a campana
Un buon esempio di curva a campana o distribuzione normale è il lancio di due dadi. La distribuzione è centrata attorno al numero sette e la probabilità diminuisce man mano che ci si allontana dal centro.
Ecco la probabilità percentuale dei vari risultati quando si tirano due dadi.
- Due: (1/36) 2.78%
- Tre: (2/36) 5.56%
- Quattro: (3/36) 8.33%
- Cinque: (4/36) 11.11%
- Sei: (5/36) 13.89%
- Sette: (6/36) 16,67% = risultato più probabile
- Otto: (5/36) 13.89%
- Nove: (4/36) 11.11%
- Dieci: (3/36) 8.33%
- Undici: (2/36) 5.56%
- Dodici: (1/36) 2.78%
Le distribuzioni normali hanno molte proprietà convenienti, quindi in molti casi, specialmente in fisica e astronomia, si presume che le variazioni casuali con distribuzioni sconosciute siano normali per consentire calcoli di probabilità. Anche se questo può essere un presupposto pericoloso, spesso è una buona approssimazione a causa di un risultato sorprendente noto come teorema del limite centrale.
Questo teorema afferma che la media di qualsiasi insieme di varianti con qualsiasi distribuzione avente una media e una varianza finite tende a verificarsi in una distribuzione normale. Molti attributi comuni come i punteggi dei test o l'altezza seguono distribuzioni pressoché normali, con pochi membri alle estremità alte e basse e molti al centro.
Quando non dovresti usare la curva a campana
Esistono alcuni tipi di dati che non seguono un normale modello di distribuzione. Questi set di dati non dovrebbero essere forzati a provare ad adattare una curva a campana. Un classico esempio potrebbe essere il voto degli studenti, che spesso ha due modalità. Altri tipi di dati che non seguono la curva includono reddito, crescita della popolazione e guasti meccanici.