Definizione di curva a campana e distribuzione normale

Il termine campana curva è usato per descrivere il concetto matematico chiamato distribuzione normale, a volte indicato come distribuzione gaussiana. "Curva a campana" si riferisce alla forma a campana che viene creata quando viene tracciata una linea utilizzando i punti dati per un elemento che soddisfa i criteri di distribuzione normale.

In una curva a campana, il centro contiene il maggior numero di un valore e, pertanto, è il punto più alto sull'arco della linea. Questo punto è riferito al significare, ma in termini semplici, è il numero più alto di occorrenze di un elemento (in termini statistici, la modalità).

Distribuzione normale

La cosa importante da notare a distribuzione normale è che la curva è concentrata al centro e diminuisce su entrambi i lati. Ciò è significativo in quanto i dati hanno meno tendenza a produrre valori insolitamente estremi, chiamati outlier, rispetto ad altre distribuzioni. Inoltre, la curva a campana indica che i dati sono simmetrici. Ciò significa che è possibile creare ragionevoli aspettative sulla possibilità che un risultato risieda all'interno di un intervallo a sinistra o a destra del centro, dopo aver misurato la quantità di deviazione contenuta nei dati. Questo è misurato in termini di

instagram viewer
deviazioni standard.

Un grafico della curva a campana dipende da due fattori: la media e la deviazione standard. La media identifica la posizione del centro e la deviazione standard determina l'altezza e la larghezza della campana. Ad esempio, una grande deviazione standard crea una campana che è corta e larga mentre una piccola deviazione standard crea una curva alta e stretta.

Probabilità della curva della campana e deviazione standard

Per comprendere i fattori di probabilità di una distribuzione normale, è necessario comprendere le seguenti regole:

  1. L'area totale sotto la curva è uguale a 1 (100%)
  2. Circa il 68% dell'area sotto la curva rientra in una deviazione standard.
  3. Circa il 95% dell'area sotto la curva rientra in due deviazioni standard.
  4. Circa il 99,7% dell'area sotto la curva rientra in tre deviazioni standard.

Gli articoli 2, 3 e 4 sopra sono talvolta indicati come regola empirica o regola 68–95–99.7. Dopo aver determinato che i dati sono normalmente distribuiti (campana curva) e calcola la media e deviazione standard, è possibile determinare il probabilità che un singolo punto dati rientrerà in una determinata gamma di possibilità.

Esempio di curva a campana

Un buon esempio di curva a campana o distribuzione normale è il lancio di due dadi. La distribuzione è centrata attorno al numero sette e la probabilità diminuisce man mano che ci si allontana dal centro.

Ecco la probabilità percentuale dei vari risultati quando si tirano due dadi.

  • Due: (1/36) 2.78%
  • Tre: (2/36) 5.56%
  • Quattro: (3/36) 8.33%
  • Cinque: (4/36) 11.11%
  • Sei: (5/36) 13.89%
  • Sette: (6/36) 16,67% = risultato più probabile
  • Otto: (5/36) 13.89%
  • Nove: (4/36) 11.11%
  • Dieci: (3/36) 8.33%
  • Undici: (2/36) 5.56%
  • Dodici: (1/36) 2.78%

Le distribuzioni normali hanno molte proprietà convenienti, quindi in molti casi, specialmente in fisica e astronomia, si presume che le variazioni casuali con distribuzioni sconosciute siano normali per consentire calcoli di probabilità. Anche se questo può essere un presupposto pericoloso, spesso è una buona approssimazione a causa di un risultato sorprendente noto come teorema del limite centrale.

Questo teorema afferma che la media di qualsiasi insieme di varianti con qualsiasi distribuzione avente una media e una varianza finite tende a verificarsi in una distribuzione normale. Molti attributi comuni come i punteggi dei test o l'altezza seguono distribuzioni pressoché normali, con pochi membri alle estremità alte e basse e molti al centro.

Quando non dovresti usare la curva a campana

Esistono alcuni tipi di dati che non seguono un normale modello di distribuzione. Questi set di dati non dovrebbero essere forzati a provare ad adattare una curva a campana. Un classico esempio potrebbe essere il voto degli studenti, che spesso ha due modalità. Altri tipi di dati che non seguono la curva includono reddito, crescita della popolazione e guasti meccanici.

instagram story viewer